Nápady a objevy

27. ledna 2016

Nový software by měl umět říci, zda je volající šťastný

Emoce volajících má v call centrech rozpoznávat počítač | Autor: pixabay

Určit, zda zaměstnanec zákaznické linky mluví s klienty podrážděně či je dlouhodobě pozitivně naladěný. To by měl za pár let umět program na detekci emocí, na jehož vývoji se podílí i studentka Fakulty informačních technologií VUT Anna Popková. Podle ní si ale například velká call centra ještě budou muset nějakou chvíli počkat. I proto, že přístroj nyní umí rozklíčovat nejpřesněji rozhovory ve francouzštině.

Schopnost analyzovat emoce v nahrávkách pouze podle hlasu bez nutnosti vidět řečníka. Věc, kterou lidský mozek do značné míry ovládá sám od sebe, by měl do budoucna převzít počítač. Bude tak schopen podle dvou hodnot říci, do jaké míry je člověk rozrušený, a zda je toto rozrušení spíše pozitivní či negativní. Tak lze shrnout projekt, na kterém se podílí i studentka FIT Anna Popková. „Je to velmi atraktivní téma, které není ještě příliš prozkoumané. Přesto je už nyní velký zájem například ze strany call center,“ upozornila Popková, která si výzkum vybrala jako téma své bakalářské práce.

Na emoce ve svém výzkumu Popková nahlíží jako na dvoudimenzionální. „Jedna dimenze se označuje arousal, což znamená, jak moc je daný řečník nabuzený. Čím vyšší číslo u arousalu, tím více je člověk energický. Druhá dimenze je pak valence, která určuje pozitivitu a negativitu,“ vysvětlila studentka. Zjednodušeně tak lze říci, že když má člověk na nahrávce vysoké hodnoty arousal i valence, je pravděpodobně nadšený a má z něčeho radost. „Když jsou naopak obě čísla nízká, tak jsme schopni říci, že je nešťastný, utlumený, až v depresi,“ dodala Popková. Výsledná čísla pro obě dimenze získává program vyhodnocením velkého množství dat jako jsou průměrná frekvence, hlasitost nebo modulace hlasu. „Je to obrovská matice, se kterou program provádí řadu matematických operací,“ objasnila Popková.

Schopnost detekovat emoce ověří i soutěž

Své teorie mohla studentka ověřit již v praxi. Spolu s týmem z takzvané Speech group při Ústavu počítačové grafiky a multimédií a ve spolupráci se společností Phonexia se zúčastnila soutěže AVEC (Audio-Visual Emotion Recognition Challenge). Od organizátorů obdrželi sedmadvacet nahrávek po pěti minutách a s jinými týmy z celého světa poměřovali schopnost určit co nejpřesněji obě dimenze. „Neměli jsme pouze audio, ale letos poprvé organizátoři poskytli soutěžícím i video nahrávky a lékařské záznamy. K dispozici jsme měli tedy i EKG či míru pocení a napětí kůže řečníků,“ dodala studentka.

Jednotlivé výsledky soutěžících pak porota porovnala se svými vlastními závěry. Podle Popkové se jejich programu zatím dařilo rozpoznávat s větší přesností arousal. „U této dimenze jsme měli okolo sedmdesátiprocentní úspěšnosti. U valence to bylo zpočátku pouze dvacet procent. Především proto, že pozitivita a negativita se snadněji poznává třeba z mimiky. U toho nám právě pomohlo dodané video a lékařské zprávy. Do budoucna je tam ale ještě hodně práce. I proto, že call centra nebudou moct lidem měřit například odpor kůže,“ vysvětlila Popková.

Podle ní je nyní hlavním problémem celého projektu nedostatek dat. „Vše, o čem mluvím, jsou zjištění, která jsme získali jen na malém vzorku a velmi omezeném množství dat. Navíc je program nyní trénovaný pouze na francouzštině, protože všechny nahrávky byly francouzsky. Tím pádem ještě nevíme, jak se bude chovat, když do něj vložíme českou nahrávku,“ upozornila Popková.

Další z problémů, se kterým se potýkali, byla skutečnost, že rozhovor vedli dva lidé, ale snímaný byl pouze jeden. „Měli jsme tam tedy řadu tichých pauz. Problém ovšem je, že člověk má emoce i v tichu,“ upozornila Popková. Výsledky pro jednotlivé úseky proto mezi sebou často vykazovaly velké rozestupy. Sledovaný mluvčí totiž mohl být vesele naladěn, ale v tiché pauze se dozvěděl něco, co ho rozrušilo. „I proto je zde velmi důležité pracovat s kontextem,“ dodala Popková, která se výzkumu hodlá věnovat i na magisterském studiu.

(zep)

Témata

Související články:
Software Adama Babince analyzuje křižovatky po celém světě
Díky výhře Ceny Wernera von Siemense jsem nastartoval kariéru, říká absolvent Jan Verner
Studenti chtějí změnit způsob, jakým komunikují radnice s občany
Michal Bidlo zjednodušil metodu pro návrh celulárních automatů
Brněnský akcelerátor opět otevírá přihlášky. V minulosti uspěli i studenti z VUT