Extrakce razítek z naskenovaných dokumentů a jejich úprava
Extraction of stamps from scanned documents and their preprocessing
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Šiller Jakub
Vedoucí práce
Jiřina Marcel
Oponent práce
Vašata Daniel
Studijní obor
Web a multimédiaStudijní program
InformatikaInstituce přidělující hodnost
katedra softwarového inženýrstvíObhájeno
2015-06-16Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Táto bakalárska práca sa zaoberá problematikou rozpoznávania a extrakcie farebných pečiatok z naskenovaných dokumentov. Popisuje proces segmentácie stránky dokumentu na kandidátske oblasti, výpočet ich atribútov, následnu klasifikáciu a úpravy extrahovanej pečiatky, ako je zvýšenie kontrastu, odstránenie šumu, či otočenie do základnej polohy. V práci sa nachádza súhrn doterajších prístupov, návrh vlastného riešenia a jeho implemetácia, ktorá je založená na strojovom učení s využitím algoritmu k najbližších susedov. Práca na záver obsahuje výsledky a vyhodnotenie testov. This bachelor thesis focuses on identification and extraction of colour stamps from scanned documents. It describes segmentation of a document page into candidates, feature extraction, classification and post processing of extracted stapms like contrast improvement, noise reduction or rotation to basic position. The thesis also includes summarized previous approaches of stamps extraction, proposal of a solution and its implementation based on machine learning that uses k nearest neighbours algorithm. At the end of the thesis, the tests results are listed.
Kolekce
- Bakalářské práce - 18102 [1729]