Praktický OCR systém založený na moderních neuronových sítích

Troller Milan

Practical OCR system based on state of art neural networks

dc.contributor.advisor	Baudiš Petr
dc.contributor.author	Troller Milan
dc.date.accessioned	2017-06-07T13:20:26Z
dc.date.available	2017-06-07T13:20:26Z
dc.date.issued	2017-05-26
dc.identifier	KOS-587864692405
dc.identifier.uri	http://hdl.handle.net/10467/68524
dc.description.abstract	Již dávno bylo jasné že OCR (Optical Character Recognition) je kýženým cí- lem. Na dosažení tohoto cíle bylo vyna- loženo v průběhu desetiletí značné úsilí. V současnosti je tento problém poklá- dán za více méně vyřešený, vzhledem k tomu že na první pohled dnes OCR fun- guje relativně dobře. Bohužel, při bliž- ším pohledu se ukazuje, že momentálně dostupné nástroje spoléhají na kontrole výstupu za pomoci slovníku, případně jazykových modelů. Toto těmto nástro- jům umožňuje porovnávat různé prav- děpodobné interpretace vstupních dat s ohledem na to, jaké výstupy jsou nej- pravděpodobnější na základě toho zda dávají jazykově smysl. Výkonnost těchto nástrojů je ale na nejazyčných datech jako jsou různé alfanumerické kódy pod- statně horší. Tato práce se pokouší o im- plementaci struktury datasetu, syntetic- kého generátoru dat pro výrobu realis- tických trénovacích dat, a konečně o im- plementaci klasifikátoru na bázi strojo- vého učení schopného fungovat na neja- zykových datech lépe než momentálně dostupná řešení.	cze
dc.description.abstract	Optical Character Recognition has been recognised as a desirable task since long ago, with much engineering effort put towards its solution over the span of decades with the current general con- sensus considering it to be a more or less "solved" as a problem as by most obvi- ous metrics OCR has been performing well for a long time. At closer inspec- tion of attainable performance with the currently available tools, it turns out that they generally rely on cross referencing results obtained from the visual data with a dictionary or some sophisticated linguistic model. This allows them to probabilistically evalu- ate various interpretations of the visual input and ensure data sanity. Their performance on non-linguistic data like codified alphanumerical strings is sig- nificantly worse. This work attempts to implement a dataset structure, a syn- thetic data generator for the generation of realistic training data and ultimately a deep neural net based classifier capa- ble of outperforming available tools in non-linguistic text recognition.	eng
dc.language.iso	ENG
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	OCR,Keras,Hluboké Učení,strojové učení,GRU layer	cze
dc.subject	OCR,Keras,Deep Learning,machine learning,GRU layer	eng
dc.title	Praktický OCR systém založený na moderních neuronových sítích	cze
dc.title	Practical OCR system based on state of art neural networks	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.date.accepted	2017-06-20
dc.contributor.referee	Listík Vít
theses.degree.discipline	Systémy a řízení	cze
theses.degree.grantor	katedra řídicí techniky	cze
theses.degree.programme	Kybernetika a robotika	cze

Soubory tohoto záznamu

Název:: F3-BP-2017-Troller-Milan-Practical ...
Velikost:: 1.174Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-BP-2017-posudek-Listik_Vit.pdf
Velikost:: 57.67Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-BP-2017-posudek-Baudis_Petr.pdf
Velikost:: 49.61Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 13135 [456]

Zobrazit minimální záznam