
Od loňského roku běží na Fakultě informačních technologií zajímavý mezinárodní projekt FactDeMice. V nejobecnější rovině se zaměřuje na pole fact-checkingu, na ověřování faktů na základě textových dokladů, detekci falešných recenzí a automatické extrakce zavádějících tvrzení. Hlavním řešitelem je dr. Martin Fajčík z Ústavu počítačové grafiky a multimédií a výzkumné skupiny KNOT@FIT. Fajčík se dlouhodobě výzkumně věnuje strojovému učení pro vyhledávání informací – projekt financovaný Technologickou agenturou ČR je tedy přirozeným pokračováním jeho odborné cesty.
I když vezmeme v úvahu jen shora uvedené telegrafické vymezení projektu, jeho možný praktický přesah a společenská relevance jsou evidentní. Online komunikace (od zpravodajských článků přes diskuzní fóra po recenze produktů) se stala rozhodujícím prostorem, kde se dnes utváří veřejné mínění. Tyto kanály jsou však zároveň terčem zneužívání: dezinformace systematicky narušují fungování trhů, podkopávají důvěru veřejnosti a v konečném důsledku ohrožují demokratické procesy. Motivace projektu FactDeMice je jasná. Opatrnost a skromnost očekávání jsou však namístě. „Zásadní problém ve světě factcheckingu je už samotná definice pravdy. A i když se jí dobereme, ještě větší výzvou je přesvědčit lidi, že tomu tak skutečně je. Zásadním zlomem v našem oboru bylo představení nástroje Community Notes na tehdejší síti Twitter. Aktuálně je jakýmsi zlatým standardem právě snaha doplňovat kontext,“ komentuje ambice nejen tohoto projektu Fajčík.
Prvním obsahovým pilířem projektu a současně primárním zájmem výzkumu brněnských odborníků zapojených do projektu je oblast dezinformací v komentářích, vyskytujících se např. na zpravodajských platformách. Konkrétně pak jejich identifikace, ověření a následné doplnění kontextu k nim. „V podstatě zkoumáme, jak by komentáře fungovaly, pokud by se k nim přidaly community notes. V České republice nebo na Slovensku není tento mechanismus příliš využívaný. Web Seznam Zprávy začal přidávat dodatečný kontext ke komentářům v roce 2023, ale to jsou fact-checky z předem připravené databáze, nikoliv poskytování kontextu na vyžádání na základě aktuálního komentáře. Tam směřujeme my. Napadlo nás totiž: Co kdybychom online platformám poskytli systém, který by automaticky pomohl moderovat dezinformace?“ komentuje jeden z klíčových cílů projektu jeho hlavní řešitel. Nástrojem pro takto vymezenou práci s komentáři jsou pro vědce zapojené do projektu velké jazykové modely. Právě prudký vývoj na poli umělé inteligence poskytl jejich práci jednu výzkumnou motivaci: V srpnu 2025 poprvé přidali community notes na síti X AI agenti. „Takže my se nyní snažíme vytvořit benchmark, který hodnotí systémy, jež vytvářejí community notes. V tom spočívá naše brněnská expertiza,“ komentuje strukturu projektových cílů Fajčík.
FactDeMice je bilaterální projekt. Druhým výzkumným partnerem je tchajwanská univerzita National Taipei University of Technology. Projekt má i byznys partnera, společnost Lingea. „Podnět pro projekt šel od nás, s tchajwanskou stranou jsme se setkali v rámci jednání delegace a následně jsme kontaktovali kolegy z Lingey. Tchaj-wan silně podporuje výzkumné projekty se zahraničními partnery.“ National Taipei University of Technology poskytuje expertizu ve druhém výzkumném pilíři. Tím je detekce falešných recenzí. Tchajwanská strana se soustředí na recenze technologických produktů, resp. ve druhé fázi půjde o zavádějící hodnocení restaurací v diskusních fórech. A opět lze ukázat na konkrétní historickou událost, která tento výzkum motivuje: V roce 2013 musela společnost Samsung zaplatit pokutu za financování kampaně falešných recenzí produktů svého konkurenta.
Cíl projektu v druhém pilíři? Identifikace falešné recenze na základě specifických příznaků. Vše se děje skrze trénování modelů strojového učení. Následně dojde k navrhování scénářů. „Budeme mít systém, který je schopen určovat falešné recenze. Poté bychom chtěli sami simulovat podobné útoky – tedy navrhovat celé umělé scénáře: Zde si nadefinujeme aktéry, motivace, recenze vygenerujeme pomocí LLM a pokusíme se zjistit, zda systémy, které jsme navrhli, jsou schopné i tyto recenze identifikovat,“ komentuje záměr Fajčík. Načež v posledním kroku přijde analýza existujících dat (recenzí), které odborníci shromažďují i na české straně, a to ve spolupráci s Lingeou.
Výsledkem projektu jsou jednak dosud neexistující datové sady plnící roli benchmarků pro komunitu. A dále konkrétní softwarový produkt. Pokud se vrátíme k prvnímu pilíři, v němž hraje FIT VUT hlavní roli, pak benchmark ve vztahu ke komentářům a odvozené softwarové řešení postupují ve čtyřech krocích (viz i infografika):
Recenze představují specifickou výzvu. Z velké většiny totiž nejsou faktuální. Stále ale mohou být falešné, a to výzkumníky zajímá. „Příznaky nepravosti jsou v jejich případě jen povrchové. Kolegové z Taipei University of Technology anotují znaky nepravosti, které jim pomáhají reálnost recenze určit,“ popisuje stav Fajčík.
Pro Martina Fajčíka není projekt FactDeMice krokem mimo jeho dosavadní výzkumnou cestu. Od roku 2018 se věnoval systémům, jež dohledávají informace a odpovídají na otázky (systémy Open Domain Question Answering). „Na tomto tématu jsem měl postavenou většinu doktorátu, po něm jsem odešel načas do Švýcarska do výzkumného institutu Idiap. Zde jsme měli projekt vyžadující podobné technologie, jenž se týkal migračních krizí, ověřování faktů a dohledávání důkazů z dat, které pocházely od samotných migrujících. Primárním cílem už nebylo odpovídat na otázky, ale hledat, co dané tvrzení podporuje a co jej vyvrací, respektive zda jej lze vůbec verifikovat. Dnes už víme, že podstatný ve fact-checkingu není verdikt, ale ‚příběh‘, kontext,“ dívá se zpětně na své výzkumné počátky Fajčík. Samozřejmě se nelze vyhnout dotazu na jeho vnímání souvislosti aktuálního projektu s celospolečenským problémem dezinformací. „Upřímně řečeno: Zajímá mě systém a matematika za ním. Dezinformace jsou součástí veřejné diskuse a kontext může pomoct je identifikovat. Záleží ale na samotných uživatelích, čtenářích, jak s kontextem naloží a zda jsou toho schopni.“
Martin Fajčík přitom poukazuje ještě na jednu zásadní souvislost práce s dezinformacemi: „Jde o oblast, která je v Česku a na Slovensku často diskutovaná, ale nesleduji, že by někdo přicházel s nějakými konkrétními technickými řešeními. A v mezinárodním prostředí přece jen existují. Poskytování kontextu ke komentářům vnímám jako demokratický prostředek.“ Projekt FactDeMice, na němž se kromě Fajčíka podílejí i doktorandi naší fakulty, má být ukončen v závěru roku 2027. Jsme samozřejmě zvědaví na jeho výstupy a řešitelům přejeme hodně úspěchů.
Zdroj: FIT VUT