Usmívejte se, hovoří prezident
Počítače se učí rozpoznat, jakou mají lidé náladu. Může to vést třeba ke sledování reakcí televizních diváků.
Ne vždy je to v praxi zřejmé, ale naše počítače nám rozumějí čím dál líp. Rozpoznávání řeči a její převod na text, na nichž počítačoví vědci začali pracovat už před šedesáti lety, se v nejrozšířenějších jazycích zlepšily natolik, že je lze docela dobře používat. (Důkazem budiž například hlasem ovládaná asistentka Siri v mobilních telefonech značky Apple, viz Respekt 7/2012.) Poslední dva roky sledujeme také rozmach pohybového ovládání (Respekt 35/2011). Nejznámějším příkladem je herní senzor Kinect, který najdeme i v Česku v desítkách tisíc domácností.
Poté co se stroje naučily „rozumět“ lidské řeči a gestům, může být dalším krokem rozpoznávání nálad a emocí. Notebook se kupříkladu zabudovanou kamerou podívá, nejsme-li už zdeptaní něčím jiným, a teprve potom nám sdělí, že musí nainstalovat dalších 112 aktualizací operačního systému. Možných využití je ovšem víc. Některá z nich jsou poněkud strašidelná.
Ten pán se nějak divně tváří
Strojové čtení nálad není úplně nová myšlenka. Psycholog Paul Ekman už na začátku sedmdesátých let vytvořil seznam emocí, které se podle něj dají z nenápadných pohybů v obličeji spolehlivě poznat a projevují se stejně u všech lidí napříč kontinenty a kulturami: vztek, znechucení, strach, štěstí, smutek a překvapení. Později doplnil seznam o další položky: pobavení, pohrdání, zahanbení, uspokojení, úlevu… a několik dalších. Ke každému hnutí mysli přidal seznam svalů, které se při něm aktivují. Systém FACS (Facial Action Coding System) se stal základem pro některé druhy detektorů lži a využívají ho také například bezpečnostní kontroly na amerických letištích, které pomocí něj hledají podezřele rozrušené pasažéry.
Ne všichni psychologové se ovšem shodnou na tom, že Ekman ze svých poznatků vyvozuje správné závěry. Kritici zpochybňují především samotnou představu, že jednotlivé emoce je možné od sebe takto oddělit a jednoznačně identifikovat. Člověk jich obvykle prožívá více zároveň, nálady se mohou rychle měnit a prolínat. A podle nedávné studie má systém na amerických letištích při rozpoznávání emocí stejnou úspěšnost, jako kdyby si ostraha u každého cestujícího hodila mincí. U respektovaných vědců, kteří s Ekmanem nesouhlasí, si tuto studii v roce 2009 objednal jeden z výborů amerického Kongresu. Z otázky čistě vědecké se stal předmět politického boje.
Dřív než politici rozhodnou o tom, jak další z řady technologií podrývajících lidské soukromí regulovat, sahají po nových možnostech draví obchodníci. K dostání je například kamerový systém, který v obchodech sleduje prodavače, zda se na zákazníky dostatečně usmívají, a zákazníky, zda snad neodcházejí z nákupu rozladěni. Microsoft si v červnu nechal patentovat technologii, jež by mu umožnila cílit reklamu na základě aktuální nálady dvaceti milionů hráčů, kteří mají doma v úvodu zmíněný senzor Kinect.
V reklamě se počítačové rozpoznávání emocí již stalo vcelku běžnou metodou, jak změřit reakci cílové skupiny na komerční sdělení. Na webu firmy Affectiva (http://www.affectiva.com/affdex/) si to můžete sami vyzkoušet. Pouštíte si různé reklamní spoty, a když to programu dovolíte, sleduje při tom webovou kamerou vaše reakce. Jakmile reklama skončí, nabídne vám podrobné grafy toho, jak intenzivně jste se usmívali, kdy jste byli překvapeni, zmateni či znechuceni.
Přesnější než lidé
Program Affdex, který to umožňuje, je komerční verzí softwaru MindReader; ten vzniká v jedné z laboratoří MIT. Počítači stačí, když má k dispozici dobře nasvícené a dost detailní video lidského obličeje. Software obraz analyzuje, označí dvaadvacet klíčových bodů jako koutky úst, obočí nebo oči a potom sleduje, jak se mění jejich vzájemná poloha, ale také například natočení celé hlavy. Jde o propracovanější variantu systému „rozpoznávání úsměvů“, který se už několik let běžně prodává v digitálních fotoaparátech.
Autoři svůj MindReader nicméně vylepšili o strojové učení. Software obsahuje „samozlepšovací“ funkci, která mu umožňuje lépe se orientovat v záplavě dat o pohybech obličejových svalů a s každým úspěšným i neúspěšným pokusem se v tom zdokonalovat. V posledních testech dokázal MindReader odlišit radostné úsměvy od ironických spolehlivěji než lidé.
Za projektem stojí Rana el Kaliouby, původem egyptská programátorka. Prodávat výsledky měření emocí reklamním agenturám je podle ní jen první krok. Ráda by svou technologii využila v politice. Jedním z prvních kroků byla instalace kamer, které v areálu univerzity průběžně měřily celkovou náladu. Časem by podle ní mohli politici takto sledovat například reakce publika na své projevy. Bývalý egyptský prezident Husní Mubarak by se tak možná dovtípil o něco dříve, že o něj národ už nestojí.
Na řadě mohou být i televizory. Nové modely často obsahují kameru, která může sledovat diváky. Pro provozovatele peoplemetrů je to splněný sen, pro jiné orwellovská noční můra. „Mám obavu, že jednoho dne by se nějaký diktátor mohl rozhodnout, že vesnici, která ho nemá ráda, vyhodí do povětří,“ strachuje se v časopisu New Scientist druhá ze zakladatelek Affdexu Rosalind Picardová a dodává, že provozovatelé takového systému by museli chránit identitu diváků. A co vy? Usmíváte se při novoročních prezidentských projevech upřímně, nebo ironicky?
Pokud jste v článku našli chybu, napište nám prosím na [email protected].