Návrh modulu pro extrakci údajů z dokumentů
Design of a Module for Information Extraction from Documents
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Krnáčová Petra
Vedoucí práce
Jiřina Marcel
Oponent práce
Hořínek Jan
Studijní obor
Softwarové inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra softwarového inženýrstvíObhájeno
2015-06-16Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Obsahom bakalárskej práce je návrh a implementácia modulu na rozpoznávanie pomenovaných entít pomocou pravidlového prístupu. Bakalárska práca tiež ponúka prehľad využívaných prístupov a nástrojov, najmä v českom prostredí a pri extrahovaní entít z naskenovaných dokumentov, prevedných pomocou metódy optického rozpoznávania znakov. The aim of this bachelor thesis is to design and to implement a module for Named Entity Recognition using rulebased approach. Another part of bachelor thesis describes existing approaches and tools used by Named Entity Recognition task, especially in Czech environment and in the extraction task in scanned documents transformed into text using Optical Character Recognition method.
Kolekce
- Bakalářské práce - 18102 [1729]