W dolinie niesamowitości

W dolinie niesamowitości

Od czasów ręcznie rysowanych kreskówek z Myszką Mickey możliwości, jakie oferuje animacja, śmiało kroczą naprzód. Produkcje ostatnich lat potrafią niejednokrotnie zaskoczyć dbałością o szczegóły obrazu (sceptykom polecam krótki film "Piper" powstały w studiach Disney i Pixar); wcale nie trzeba też być zapalonym graczem, by dać się oczarować bogatym krajobrazom po przypadkowym trafieniu do pokoju z uruchomionym najnowszym Wiedźminem na ekranie. Przemysł rozrywkowy prześciga się w dostarczaniu swoim odbiorcom jak najbardziej realistycznych wrażeń. W końcu, im wierniejsze odwzorowanie falowania włosów głównego bohatera lub ruchów oddechowych jego klatki piersiowej, tym głębsza immersja widzów, czyż nie?

„Jak to mnie zachwyca, kiedy mnie nie zachwyca?”

W 1970 roku japoński inżynier robotyki, Masahiro Mori opisał ciekawy fenomen. Według Masahiro roboty wzbudzają w ludziach pozytywne odczucia tym bardziej, im wygląd ich bliższy jest człowieczemu. Tak, na przykład robot-zabawka w kształcie lalki podoba nam się bardziej niż mechaniczne ramię skręcające śruby w fabryce. Jednak po przekroczeniu pewnej granicy realizmu silne podobieństwo robota do prawdziwego człowieka zaczyna rodzić raczej nieprzyjemne uczucie zaniepokojenia niż ekscytację. Zjawisko to nazwał Masahiro "doliną niesamowitości" (ang. uncanny valley). To trochę tak, jak gdybyśmy chcieli napisać horror. Można opisywać najdziwniejsze potwory i monstra, jakie przyjdą nam do głowy. Ale jeśli chcemy na prawdę przerazić czytelnika, pokażmy mu istotę mówiącą i poruszającą się jak człowiek, na pozór nie do odróżnienia od sąsiada widzianego codziennie w windzie lub nieznajomego mijanego na ulicy - i tylko jej źrenice są nieco zbyt szerokie w pełnym słońcu, a przy uśmiechu nie wszystkie mięśnie mimiczne ustawiają się do końca tak jak trzeba... Oto jak działa efekt doliny niesamowitości. Pewna doza nienaturalności nie przeszkadza nam u tylko przypominających człowieka postaci, jednak kiedy podobieństwo jest zbyt bliskie, nawet drobny szczegół potrafi wywołać zaniepokojenie.

Założenia brzmią przekonująco, jednak w dyskusjach nadal podnosi się brak bezpośrednich dowodów, jak i niedostateczny wgląd w neurologiczne mechanizmy powstawania tego efektu.

Jak mózg widzi twarze?

Z pomocą przychodzą: seria obrazków ukazujących ludzką twarz w sześciu stylizacjach (w zamierzeniu autorów badania, przypominających style wykorzystywane w przemyśle rozrywkowym) różniących się stopniem realizmu oraz zapis EEG.

W percepcji twarzy udział biorą obszary ulokowane głównie w korze potylicznej oraz w zakręcie wrzecionowatym płata skroniowego. Bodziec, jakim jest widok ludzkiej twarzy, powoduje powstanie potencjału N170 (czyli negatywnego - to jest o ujemnej amplitudzie - potencjału pojawiającego się po upływie około 140-200 milisekund od prezentacji bodźca), ten zaś jesteśmy w stanie zarejestrować przy pomocy badania EEG. Wzbudzenie potencjału N170 jest specyficzną odpowiedzą mózgu na obraz twarzy, stąd jego wysoka użyteczność w badaniach nad percepcją tego rodzaju bodźców. Co więcej, mierząc amplitudę N170, naukowcy odkryli (Proverbio, Riva, Martin i Zani, 2010; Hinojosa, Mercado i Carretié, 2015), że zmienia się ona w zależności od szczegółów prezentowanej badanym twarzy, i na przykład większa jest dla twarzy naszego własnego gatunku, a także w przypadku twarzy wyrażających silne emocje lub twarzy niemowlęcia (jest coś hipnotyzującego w tych dużych oczętach i uśmiechu, prawda?). Innymi użytymi w opisywanym badaniu potencjałami wywołanymi były: potencjał EPN, odzwierciedlający wczesne mechanizmy pobudzenia uwagi oraz potencjał LPP wiązany z kodowaniem napływających informacji w pamięci epizodycznej i procesami bardziej zaawansowanej oceny bodźców.

Co z emocjami?

Przy użyciu tych narzędzi badacze mieli nadzieję pogłębić nasze zrozumienie tego, w jaki sposób mózg radzi sobie z przetwarzaniem owego specyficznego, przez swoje ogromne znaczenie w relacjach społecznych, bodźca, jakim jest widok twarzy. Odczyty EEG trzydziestu trzech ochotników, którym w losowej kolejności wyświetlano przygotowane obrazy - twarz męską lub kobiecą, od zupełnie nierealistycznego wyglądu poprzez coraz bardziej realistyczne odwzorowania aż do rzeczywistej fotografii - wykazały znaczne różnice w postrzeganiu twarzy prawdziwych oraz animowanych, przejawiające się w komponentach N170 i LPP. Podczas gdy amplituda LPP (dla przypomnienia - odzwierciedlająca procesy pamięciowe oraz klasyfikowanie) rosła liniowo, wraz z wzrastającym stopniem realizmu obrazów, wykres amplitudy potencjału N170 przypominały raczej odwróconą parabolę, największe pobudzenie osiągając dla obrazów przedstawiających pozycje skrajne z obu końców spektrum realizmu. Dodatkowo naukowcy wprowadzili kolejną zmienną - każda z twarzy mogła mieć wyraz neutralny bądź przedstawiać jedną z dwóch emocji: złość lub szczęście - uzyskując efekt zmiany amplitudy tym razem dla N170 oraz EPN, najbardziej nasilony dla złości, najsłabiej zaś dla mimiki sygnalizującej neutralność. Zebrane dane pozwalają na wysunięcie kilku hipotez dotyczących percepcji twarzy. Brak istotnego wpływu realizmu twarzy na potencjał ENP skłania do stwierdzenia, że poświęcamy oglądanym obliczom tyle samo koncentracji, bez względu na to, czy widzimy prawdziwych ludzi czy postacie z animacji. Skutecznie za to naszą uwagę przykuwają emocje, zwłaszcza te, mogące sygnalizować zagrożenie (jak np. złość). Współdziałanie zarówno poziomu stylizacji jak i ładunku emocjonalnego obrazków na kształt N170 sugeruje, iż przetwarzanie obu tych cech nie odbywa się osobnymi szlakami, a raczej zostaje na wczesnym etapie zintegrowane. Mimo to więcej zasobów pamięciowych angażowanych jest w przetwarzanie obrazów bardziej realistycznych (wyższa amplituda LPP) - badacze wskazują na większą szczegółowość oraz wyższą skłonność do przypisywania im np. cech osobowości. Realne fotografie silniej pobudzają także specyficzny dla twarzy potencjał N170; jego wysokie pobudzenie podczas oglądania twarzy mocno abstrakcyjnych badacze tłumaczą prezentowaniem przez nie cech podobnych do twarzy niemowlęcia (np. proporcjonalnie duże oczy).

Spór o dolinę niesamowitości: efekt istnieje czy nie?

Co może wynikać z tych rezultatów? Po pierwsze naukowcom udało się udowodnić, że mózg nieco inaczej podchodzi do twarzy animowanych niż prawdziwych. Co więcej, dokładniejsze analizy ujawniły, iż różnice te dotyczą nie tylko amplitudy potencjałów N170 i LPP, ale także aktywnych podczas oglądania obrazów obszarów kory - fotografie prawdziwych twarzy największe pobudzenie potencjału N170 wzbudzały w okolicy dolnej przyśrodkowej kory potylicznej wraz z postępującą utratą realizmu obrazków, szczyt pobudzenia przesuwał się w kierunku zakrętu językowatego oraz klinka. Podobna zależność występuje także dla potencjału LPP, z silniejszym pobudzeniem regionów położonych nieco wyżej dla twarzy bardziej realistycznych. Jest to zła wiadomość dla tych naukowców, którzy, z powodu łatwiejszej dostępności do modyfikacji, w badaniach nad ludzkim postrzeganiem twarzy używają komputerowo generowanych postaci, gdyż wyniki takich prac mogą okazać się nieadekwatne do procesów zachodzących w realnych interakcjach społecznych.

Co zaś z doliną niesamowitości? Niestety, badaczom nie udało się odnaleźć potencjalnych źródeł efektu postulowanego przez Masahiro. Wygląda więc na to, że spór na temat doliny niesamowitości nadal ma się dobrze.

Na podstawie:

Schindler, S., Zell, E., Botsch, M., Kissler, J. (2017). Differential effects of face-realism and emotion on event-related brain potentials and their implications for the uncanny valley theory.  Scientific Reports 7, Article number: 45003, Doi: 10.1038/srep45003

Bibliografia:

Hinojosa, J. A., Mercado, F., Carretié, L. (2015). N170 sensitivity to facial expression: A meta-analysis. Neuroscience and Biobehavioral Reviews 55,  498–509, Doi: 10.1016/j.neubiorev.2015.06.002

Masahiro, M. (2012) The Uncanny Valley: The Original Essay by Masahiro Mori (translated by: Karl F. MacDorman and Norri Kageki). Pobrano 7 kwiecień 2017 z http://spectrum.ieee.org/automaton/robotics/humanoids/the-uncanny-valley

Proverbio, A. M., Riva, F., Martin, E.,  Zani, A.  (2010). Face Coding Is Bilateral in the Female Brain. PLoS ONE 5, e11242 , Doi: 10.1371/journal.pone.0011242

Stix, G. (2008). Robot Cartoons--Cute; Robot Humans—Creepy. Pobrano 7 kwiecień 2017 z https://www.scientificamerican.com/article/robot-cartoons-cute/

Wykorzystany cytat pochodzi z książki „Ferdydurke” Witolda Gombrowicza.

 

Naukowcy wywołali halucynacje wzrokowe u myszy, wykorzystując światło do stymulacji niewielkiej liczby komórek w mózgu. Badan... czytaj więcej
Muzykę wykorzystywano w leczeniu różnych stanów chorobowych, dotykających zarówno ciała, jak i psychiki, od zarania ludzkości... czytaj więcej
Klasyczne zastosowanie DBS – choroba Parkinsona Głęboka stymulacja mózgu (ang. deep brain stimulation, DBS) jest metodą z obs... czytaj więcej
W celu zapobiegania wielu patologiom wynikającym z siedzącego trybu życia Światowa Organizacja Zdrowia zaleca, aby ćwiczenia... czytaj więcej