Obrazová detekce a extrakce informací z dokladů
Information detection and extraction from ID cards
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Matyáš Rousek
Vedoucí práce
Novák Jakub
Oponent práce
Smítková Janků Ladislava
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Práce se zabývá ziskem textových informací z fotografií osobních dokladů. Je navržen a implementován postup využívající konvoluční neuronové sítě U-Net natrénované na tvorbu segmentační masky pro zisk dokladu z reálné scény. V rámci nalezeného dokladu jsou vyříznuty oblasti s textem, v nichž je text blíže lokalizován na základě barvy a je přečten knihovnou Tesseract. Na testovací sadě 48 fotografií dokladů je dosaženo přesnosti 98,4 % správně přečtených znaků a pokrytí 92,6 %. Přínosem práce je extrakce textových informací i z fotografií dokladů vyskytujících se v obrazově komplikované scéně. The thesis is about extraction of text information from photographs of identity documents. Proposed method uses convolutional neural network U-Net trained to create segmentation mask to find ID card in natural scene. Text is detected within known areas and is read using Tesseract library. The character recognition precision is 98,4 % and recall is 92,6 % on 48 tested photos of documents.
Kolekce
- Bakalářské práce - 18105 [295]