Nápady a objevy

18. července 2017

Na FITu umí doostřit nekvalitní fotky i text. Potřebovali k tomu statisíce obrázků

Metodu, kterou používají na FITu, lze využít například k rozpoznávání SPZ aut z kamer | Autor: Michal Hradiš

Každému se občas povede vyfotit fotografii, která není zrovna kvalitní a nelze na ní rozpoznat detaily. Pomocí počítačových programů se dá leccos zachránit. Tam, kde končí schopnosti klasických softwarů, je ale potřeba složitějších operací. Na Fakultě informačních technologií VUT proto zkoumají úpravy fotografií konvolučními neuronovými sítěmi. Díky tomu budou možná některé historické dokumenty z Moravské zemské knihovny ostřejší a čitelnější.

Konvoluční neuronové sítě se dnes využívají zejména v oblasti umělé inteligence. Tým Michala Hradiše se rozhodl po nich sáhnout i při výzkumu automatického doostřování fotografií a jiných oprav vad obrazu. Dva roky tak učili tyto sítě poznat, která fotografie je kvalitní, a jak ty nedokonalé správně zpracovat tak, aby co nejvíce odpovídaly skutečnosti. „Měli jsme k dispozici několik stovek tisíc dvojic obrázků, kdy vždy jeden byl v dobré kvalitě a druhý jsme uměle rozmazali. Konvoluční sítě se dokážou z takových příkladů naučit nekvalitní obrázky měnit tak, aby se co nejvíce podobaly kvalitnímu originálu. Když jim předložíme dostatečné množství trénovacích příkladů, dokážou časem opravit i reálné fotografie, které ještě neviděly,“ vysvětlil Michal Hradiš z Ústavu počítačové grafiky a multimédií. Tato metoda je velmi úspěšná například při focení textových dokumentů mobilem, kdy i nečitelné fotografie se po zpracování blíží kvalitě ze stolních skenerů. Nejenže jsou zaostřené dokumenty čitelnější, ale i mnohem lépe na nich funguje OCR neboli automatické rozpoznání textu.

Porovnání nekvalitních snímků s obrázky upravenými počítačovým programem | Autor: Michal Hradiš

Výzkumníci z fakulty se také zaměřili na videa, především ze silničních kamer. Dělali totiž experimenty s SPZ aut zachycených na snímcích z dálničních kamer na mýtných bránách. Program je tak schopen z nepříliš ostrého záznamu určit, o jakou poznávací značku auta se jedná. Zatím se metoda v této oblasti nevyužívá, ale v budoucnu by mohla najít uplatnění například u bezpečnostních složek.

Momentálně vědci pracují na zdokonalení metody pro texty. „Připravujeme projekt, kdy se budeme snažit rekonstruovat staré tisky a rukopisy. Moravská zemská knihovna má digitální archiv, kde zpřístupňují některé staré dokumenty, například staré noviny. Některé skeny jsou sice čitelné, ale velmi špatně. A právě na nich děláme první pokusy s konvolučními neuronovými sítěmi,“ objasnil plány do budoucna Hradiš. Omezením je, že poškozený dokument musí zachovat alespoň nějakou informaci o původním obsahu. Například menší utržená místa je sice možné doplnit a výsledek bude na první pohled vypadat věrohodně, ale text nebude dávat smysl. Podobně může například dojít k záměně písmen nebo změně fontu při přílišném rozmazání.

Pomocí konvolučních neuronových sítí lze upravovat i texty | Autor: Michal Hradiš

Konvolučními neuronovými sítěmi se na Fakultě informačních technologií zabývají už řadu let a neustále pro ně hledají nové a nové aplikace. Začínali s rozpoznáváním a vyhledáváním obsahu fotek, ale tomuto tématu se dnes již věnují výzkumné týmy velkých firem, jako je třeba Google nebo Facebook. Proto se na FITu zaměřují především na ty oblasti, kde se jejich další využití teprve hledá.

(kah)

Témata

Související články:
Výzkumníci z VUT využili umělou inteligenci, aby uspořila energii v počítačích
Michal Bidlo zjednodušil metodu pro návrh celulárních automatů
Anonymizační software umí sám upravovat videa. Hodí se pro policii i média
Až 400 gigabitů za sekundu. Odborníci z FIT VUT vyvinuli jednu z nejrychlejších akceleračních síťových karet na světě
Poznají, kdo na nahrávkách mluví. Jejich aplikace pořizují tajné služby i úvěrové společnosti