Téma

14. května 2026

Projekt FactDeMice: AI jako pomocník novinářů a firem, ne arbitr pravdy

Martin Fajčík (uprostřed), hlavní řešitel projektu FactDeMice spolu s kolegy z FIT VUT a zástupcem partnerské National Taipei University of Technology. | Autor: Archiv FIT VUT

Od loňského roku běží na Fakultě informačních technologií zajímavý mezinárodní projekt FactDeMice. V nejobecnější rovině se zaměřuje na pole fact-checkingu, na ověřování faktů na základě textových dokladů, detekci falešných recenzí a automatické extrakce zavádějících tvrzení. Hlavním řešitelem je dr. Martin Fajčík z Ústavu počítačové grafiky a multimédií a výzkumné skupiny KNOT@FIT. Fajčík se dlouhodobě výzkumně věnuje strojovému učení pro vyhledávání informací – projekt financovaný Technologickou agenturou ČR je tedy přirozeným pokračováním jeho odborné cesty.

Dezinformace v komentářích? Kontext je král

I když vezmeme v úvahu jen shora uvedené telegrafické vymezení projektu, jeho možný praktický přesah a společenská relevance jsou evidentní. Online komunikace (od zpravodajských článků přes diskuzní fóra po recenze produktů) se stala rozhodujícím prostorem, kde se dnes utváří veřejné mínění. Tyto kanály jsou však zároveň terčem zneužívání: dezinformace systematicky narušují fungování trhů, podkopávají důvěru veřejnosti a v konečném důsledku ohrožují demokratické procesy. Motivace projektu FactDeMice je jasná. Opatrnost a skromnost očekávání jsou však namístě. „Zásadní problém ve světě factcheckingu je už samotná definice pravdy. A i když se jí dobereme, ještě větší výzvou je přesvědčit lidi, že tomu tak skutečně je. Zásadním zlomem v našem oboru bylo představení nástroje Community Notes na tehdejší síti Twitter. Aktuálně je jakýmsi zlatým standardem právě snaha doplňovat kontext,“ komentuje ambice nejen tohoto projektu Fajčík.

Prvním obsahovým pilířem projektu a současně primárním zájmem výzkumu brněnských odborníků zapojených do projektu je oblast dezinformací v komentářích, vyskytujících se např. na zpravodajských platformách. Konkrétně pak jejich identifikace, ověření a následné doplnění kontextu k nim. „V podstatě zkoumáme, jak by komentáře fungovaly, pokud by se k nim přidaly community notes. V České republice nebo na Slovensku není tento mechanismus příliš využívaný. Web Seznam Zprávy začal přidávat dodatečný kontext ke komentářům v roce 2023, ale to jsou fact-checky z předem připravené databáze, nikoliv poskytování kontextu na vyžádání na základě aktuálního komentáře. Tam směřujeme my. Napadlo nás totiž: Co kdybychom online platformám poskytli systém, který by automaticky pomohl moderovat dezinformace?“ komentuje jeden z klíčových cílů projektu jeho hlavní řešitel. Nástrojem pro takto vymezenou práci s komentáři jsou pro vědce zapojené do projektu velké jazykové modely. Právě prudký vývoj na poli umělé inteligence poskytl jejich práci jednu výzkumnou motivaci: V srpnu 2025 poprvé přidali community notes na síti X AI agenti. „Takže my se nyní snažíme vytvořit benchmark, který hodnotí systémy, jež vytvářejí community notes. V tom spočívá naše brněnská expertiza,“ komentuje strukturu projektových cílů Fajčík.

V hledáčku jsou i falešné recenze

FactDeMice je bilaterální projekt. Druhým výzkumným partnerem je tchajwanská univerzita National Taipei University of Technology. Projekt má i byznys partnera, společnost Lingea. „Podnět pro projekt šel od nás, s tchajwanskou stranou jsme se setkali v rámci jednání delegace a následně jsme kontaktovali kolegy z Lingey. Tchaj-wan silně podporuje výzkumné projekty se zahraničními partnery.“ National Taipei University of Technology poskytuje expertizu ve druhém výzkumném pilíři. Tím je detekce falešných recenzí. Tchajwanská strana se soustředí na recenze technologických produktů, resp. ve druhé fázi půjde o zavádějící hodnocení restaurací v diskusních fórech. A opět lze ukázat na konkrétní historickou událost, která tento výzkum motivuje: V roce 2013 musela společnost Samsung zaplatit pokutu za financování kampaně falešných recenzí produktů svého konkurenta.

Cíl projektu v druhém pilíři? Identifikace falešné recenze na základě specifických příznaků. Vše se děje skrze trénování modelů strojového učení. Následně dojde k navrhování scénářů. „Budeme mít systém, který je schopen určovat falešné recenze. Poté bychom chtěli sami simulovat podobné útoky – tedy navrhovat celé umělé scénáře: Zde si nadefinujeme aktéry, motivace, recenze vygenerujeme pomocí LLM a pokusíme se zjistit, zda systémy, které jsme navrhli, jsou schopné i tyto recenze identifikovat,“ komentuje záměr Fajčík. Načež v posledním kroku přijde analýza existujících dat (recenzí), které odborníci shromažďují i na české straně, a to ve spolupráci s Lingeou.

Benchmarky i softwarový nástroj

Výsledkem projektu jsou jednak dosud neexistující datové sady plnící roli benchmarků pro komunitu. A dále konkrétní softwarový produkt. Pokud se vrátíme k prvnímu pilíři, v němž hraje FIT VUT hlavní roli, pak benchmark ve vztahu ke komentářům a odvozené softwarové řešení postupují ve čtyřech krocích (viz i infografika):

  1. Posouzení smysluplnosti ověřování komentáře – z hlediska jeho společenské relevance, toho, zda nejde např. o pouhé vulgarismy či čistě subjektivní stanovisko autora, atd. Tímto prvním sítem projde na českých a slovenských platformách, které výzkum zohledňuje, jen třetina komentářů. Samozřejmě také v závislosti na tématu, zda jde např. o tabloid typu Blesk.cz nebo třeba technickou doménu, jako je Lupa.cz.
  2. Pokud je identifikován komentář, který si ověření zaslouží, je třeba z něj extrahovat tvrzení, jež chceme ověřovat. Zde spočívá problém v následující podmínce, která musí být dodržena: Tvrzení v komentáři musí být pochopitelné samo o sobě, bez vlastního článku i následných či předcházejících reakcí. Opět jde o poměrně jemné síto obsahu.
  3. Ve třetím kroku se dohledává evidence ve webových zdrojích s určením přesného místa. Martin Fajčík zdůrazňuje, že systém nemá posuzovat pravdivost/nepravdivost tvrzení, spoléhá se na četnost odkazování na zdroj – do budoucna může správce či uživatel systému nastavit jako rozhodný např. rating zdroje (připomenout lze existující rating agentury Reuters).
  4. Posledním krokem je pak generování finálních strukturovaných sumarizací pro uživatele.

Recenze představují specifickou výzvu. Z velké většiny totiž nejsou faktuální. Stále ale mohou být falešné, a to výzkumníky zajímá. „Příznaky nepravosti jsou v jejich případě jen povrchové. Kolegové z Taipei University of Technology anotují znaky nepravosti, které jim pomáhají reálnost recenze určit,“ popisuje stav Fajčík.

Oblast, o níž se hodně mluví, ale řešení chybí

Pro Martina Fajčíka není projekt FactDeMice krokem mimo jeho dosavadní výzkumnou cestu. Od roku 2018 se věnoval systémům, jež dohledávají informace a odpovídají na otázky (systémy Open Domain Question Answering). „Na tomto tématu jsem měl postavenou většinu doktorátu, po něm jsem odešel načas do Švýcarska do výzkumného institutu Idiap. Zde jsme měli projekt vyžadující podobné technologie, jenž se týkal migračních krizí, ověřování faktů a dohledávání důkazů z dat, které pocházely od samotných migrujících. Primárním cílem už nebylo odpovídat na otázky, ale hledat, co dané tvrzení podporuje a co jej vyvrací, respektive zda jej lze vůbec verifikovat. Dnes už víme, že podstatný ve fact-checkingu není verdikt, ale ‚příběh‘, kontext,“ dívá se zpětně na své výzkumné počátky Fajčík. Samozřejmě se nelze vyhnout dotazu na jeho vnímání souvislosti aktuálního projektu s celospolečenským problémem dezinformací. „Upřímně řečeno: Zajímá mě systém a matematika za ním. Dezinformace jsou součástí veřejné diskuse a kontext může pomoct je identifikovat. Záleží ale na samotných uživatelích, čtenářích, jak s kontextem naloží a zda jsou toho schopni.“

Martin Fajčík přitom poukazuje ještě na jednu zásadní souvislost práce s dezinformacemi: „Jde o oblast, která je v Česku a na Slovensku často diskutovaná, ale nesleduji, že by někdo přicházel s nějakými konkrétními technickými řešeními. A v mezinárodním prostředí přece jen existují. Poskytování kontextu ke komentářům vnímám jako demokratický prostředek.“ Projekt FactDeMice, na němž se kromě Fajčíka podílejí i doktorandi naší fakulty, má být ukončen v závěru roku 2027. Jsme samozřejmě zvědaví na jeho výstupy a řešitelům přejeme hodně úspěchů.

Zdroj: FIT VUT

Témata

Související články:
Chybí konec hovoru, zahlásí unikátní program Netfox Detective
Nový software by měl umět říci, zda je volající šťastný
Tomáš Horáček: Pomáháme firmám dělat z jejich zaměstnanců headhuntery
Díky výhře v soutěži strávila doktorandka z FITu dva měsíce u superpočítače
Mladí profesoři se shodují: Profesura byl přirozený vývoj, neplánovali jsme to