Automatické zpracování tištěné papírové účtenky za palivo
Automated processing of printed fuel receipt
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Martin Šafránek
Vedoucí práce
Jirovský Václav
Oponent práce
Kalvoda Tomáš
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Práce porovnává úspěšnosti několika postupů pro rozpoznání ceny, času a datumu na tištěné účtence za palivo s použitím OCR nástroje Tesseract. V předzpracování účtenky zkoumá vliv Sauvolova binarizačního algoritmu a mediánového filtru. Pro odhad zkosení účtenky srovnává Houghovu transformaci a metodu lineární regrese s K-means. Celé řešení je implementováno ve formě webové aplikace a porovnáno s Google Vision. Nejlepší úspěšnost řešení je pro datum, které na účtence nalezne v 73 % případů v porovnání s 92 % u Google Vision. The thesis compares several methods for price, time and date recognition on printed fuel receipt using OCR tool Tesseract. In preprocessing step, Sauvola binarization and median filter impact is studied. For skew estimation, Hough transformation and linear regression with K-means are compared. This process is implemented as a web application and compared with Google Vision. The best method result is 73% for date extraction compared to 92% with Google Vision.
Kolekce
- Bakalářské práce - 18105 [295]