Hrát si s umělou inteligencí a její schopností vygenerovat skoro jakýkoli ilustrační obrázek může být celkem zábava. Už se vám ale stalo, že jste uviděli téměř realistickou tvář vytvořenou počítačem a pocítili prazvláštní úzkost? Nejste sami. Lidé jev zažívají od vzniku prvních antropomorfních robotů a vědci pro něj mají vysvětlení.
Propad na grafu komfortu
Napodobeniny člověka vyvolávající efekt tísnivého údolí – uncanny valley – jsou dnes hojně rozšířené. Samotná teorie vznikla ve 20. století na základě diskomfortu, který lidé nezřídka pociťují při pohledu na humanoidní stroje. Poslední dobou ale můžeme tento jev snadno zažít i na internetu, například z téměř fotorealistických portrétů vygenerovaných AI. Stává se to také u některých nedokonalých deepfakes. Tedy videí upravených tak, aby vyobrazený člověk vypadal jako někdo úplně jiný, například v rámci dezinformačních kampaní.
Představte si dvourozměrný graf. Svislá osa představuje směrem nahoru čím dál větší pocit blízkosti a známosti, po vodorovné ose stoupá skutečná podobnost s člověkem. Blízko nule patří cokoliv, co se člověku nepodobá vůbec – dejme tomu třeba kufr. Ten bude na nule jak co do podobnosti, tak i na ose pocitu blízkosti, protože v něm člověk, který ho vidí, nespatřuje druhou živou bytost.
O něco dále od nuly se může nacházet třeba kreslená postavička – ta už je schematickým znázorněním člověka a pomyslný pozorovatel si ji takto ztotožní. Když se zvyšuje realističnost vyobrazení, roste i pocit, že vidíme něco, co je nám povědomé. Na sto procentech by se nacházela druhá osoba – třeba v reálné konverzaci nebo ve filmu.
Linka však nevede šikmo vzhůru. Pokud je něco velmi realistické, ale ne úplně, pocit spřízněnosti a něčeho povědomého se nachází až v záporných hodnotách. Znamená to, že výjev, který zároveň je i není lidský, vnímají někteří lidé jako znepokojivý či děsivý.
Právě tomuto strmému propadu čáry na grafu se říká uncanny valley, česky většinou tísnivé údolí. Podle původního diagramu hovoříme o hodnotách podobnosti zhruba mezi 70 a 90 % – potom emoční komfort znovu prudce stoupá. Dokonalá AI by tedy hypoteticky mohla vytvořit portrét, který tísnivé údolí překoná. Jinak řečeno, nejstrašidelnější jsou ty skoro dokonalé obličeje, v nichž je však něco znepokojujícího špatně. Alespoň pro náš mozek.
Chcete příklad? Tady máte jeden z roku 2004. Tehdy se v kinech objevily dva animované, a přitom hodně odlišné filmy: Úžasňákovi a Polární expres. Mnoho lidí preferovalo úmyslně stylizovaný vzhled postav v rodince Úžasňákových před lidsky vypadajícími postavami v Polárním expresu, které byly pro nemálo lidí poněkud strašidelné.
Roboti vyvolávali úzkost už v 70. letech
Samotný graf týkající se lidského vnímání nejen obrazů, ale také mechanických výtvorů včetně androidů, pochází z Japonska, známé velmoci robotiky. Jeho autorem byl inženýr Mori Masahiro. Jeho esej z roku 1970 používá pro jev v souvislosti s grafem pojem bukimi no tani, později přeložený právě jako uncanny valley.
Text se ve velkém zaměřuje na lidské vnímání designu automatů a robotů. Robotická paže či dětský robotek na hraní tísnivý efekt moc nevyvolávají, neboť se nepodobají člověku. Usmívající se robot, který byl k vidění na Světové výstavě 1970 v Ōsace, byl však znepokojivý, proto jej autor použil jako typický příklad. Do tísnivého údolí také patří kupříkladu protéza ruky. Velkou roli v míře tísnivosti hraje pohyb, který efekt umocňuje: zombie například bude mnohem děsivější než samotný pohled na mrtvé tělo.
Jaké pocity ve vás vyvolávají fotky vytvořené AI?
Mori se příliš nesnaží analyzovat psychologii za tísnivým údolím, ale pár krátkými odstavci naznačuje svůj názor na možnou příčinu a motivuje odbornou veřejnost k výzkumu této problematiky. Měli bychom začít stavět přesnou mapu tísnivého údolí, abychom skrze výzkum robotiky porozuměli tomu, co nás dělá lidmi. Taková mapa je také nutná na to, abychom – pomocí designu bez lidské podoby – mohli tvořit zařízení, se kterými mohou lidé pohodlně navázat kontakt,
napsal mimo jiné.
Základy už u Freuda a Jentsche
Koncept něčeho zároveň povědomého i cizího popsali myslitelé už před více než sto lety. Přídavné jméno pro něj zní v angličtině uncanny, v němčině unheimlich („ne-domácký“). Český ekvivalent se hledá stěží, slova se překládají jako „tísnivý“, „strašidelný“ či „prapodivný“.
Pojem unheimlich takto poprvé použil německý psychiatr Ernst Jentsch ve svém eseji Zur Psychologie des Unheimlichen z roku 1906. Ten samozřejmě neznal roboty a své úvahy stavěl na hororových příbězích, voskových figurínách, ale také na psychickém nepohodlí, které může vyvolat pohled na něčí epileptický záchvat, či projevy „šílenství“. Za důležitý faktor pokládá nejistotu a nesoulad mezi představou živého a mrtvého.
V roce 1919 na toto navazuje Sigmund Freud esejem Das Unheimliche (česky Něco tísnivého). V tom se objevuje definice jako „něco povědomého a zároveň cizího“. Tísnivé nám podle Freuda údajně podvědomě připomíná naše id (instinktuální a živočišnou stránku osobnosti) a potlačené impulzy, které nás děsí, protože odporují společenskému tabu.
Je mozek zmatený, či se bojí nemoci?
Důvodů, proč můžeme mít nekomfortní pocity z AI fotek, robotí chůze, ale třeba i z konverzace s náměsíčným spolubydlícím, bylo navrženo mnoho. Ne všichni psychologové zrovna uznávají podobu Moriho diagramu.
Esej o tísnivém údolí koneckonců neměl být vědeckou hypotézou jako takovou, spíše odrazovým můstkem pro to, aby se působení ne-dost-lidských výjevů na náš emoční stav začalo řádně zkoumat. A také, že začalo – vědci se například snaží správně nadefinovat proměnné grafu a ověřovat, kam až efekt sahá a jaké to má praktické důsledky. My si pro stručnost uvedeme pár možných příčin, proč tísnivé údolí vůbec existuje.
Jedna z významných teorií pracuje s efektem kategorického vnímání. Ten znamená, že když je člověk zvyklý rozdělovat podněty do kategorií, ovlivňuje to jeho samotné vnímání daných podnětů. Profesor Roger K. Moore zkoumal tísnivé údolí pomocí této teorie a statistických metod. Podle jeho studie publikované v roce 2012 způsobují úzkost takové vjemy, které v sobě kombinují složky patřící do různých kategorií – jde pak vlastně o špatně uspořádané podněty. Člověk je tedy vlastně nervózní, protože jeho mozek plně nechápe, co to vlastně vidí nebo slyší.
Neurologické měření ukázalo, že vidět něco podobného člověku znamená zpřísnit své normy na posuzování, zda se to chová podle našich očekávání. Účastníci experimentu se dívali na živého člověka, viditelně kovového robota a na lidsky namaskovaného androida pohybujícího se jako stroj. U obou stimulů vypadajících jako člověk se aktivovalo to samé centrum v mozku. Tento experiment přispívá k názoru, že náš mozek v tísnivém údolí vidí člověka, který porušuje normy lidství, ne věc, která celkem vypadá jako člověk.
Jiný návrh sahá ještě hlouběji do naší pudové stránky a říká, že tento odpor je daný evolučně. Nedostatečně lidské pohyby či rysy ve tváři si prý nevědomě ztotožňujeme s nemocí a slabostí. Díky úzkosti, kterou nám daná spatřená postava způsobí, se k ní nebudeme přibližovat a vyhneme se případné nákaze nebo jinému nebezpečí. To se týká hlavně těžce nemocných lidí a mrtvol, ale v dnešní době tedy i robotů a jiných realistických humanoidů vykazujících stejné vlastnosti.
Hypotéz o příčině efektu tísnivého údolí je více a některé z nich se prolínají i s vědomými obavami společnosti – například že nás roboti nahradí nebo ovládnou.
Zdroje:
Britannica: Uncanny Valley
IEEE Spectrum: What Is the Uncanny Valley?
MORI, Masahiro: The Uncanny Valley (1970)
Design Kisk: Tísnivé údolí (Uncanny valley)
MEAH, Lianne F.S. & MOORE, Roger K.: The Uncanny Valley: A Focus on Misaligned Cues. University of Sheffield, 2014