Návrh modulu pro extrakci údajů z dokumentů
Design of a Module for Information Extraction from Documents
Type of document
bakalářská prácebachelor thesis
Author
Krnáčová Petra
Supervisor
Jiřina Marcel
Opponent
Hořínek Jan
Field of study
Softwarové inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra softwarového inženýrstvíDefended
2015-06-16Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Show full item recordAbstract
Obsahom bakalárskej práce je návrh a implementácia modulu na rozpoznávanie pomenovaných entít pomocou pravidlového prístupu. Bakalárska práca tiež ponúka prehľad využívaných prístupov a nástrojov, najmä v českom prostredí a pri extrahovaní entít z naskenovaných dokumentov, prevedných pomocou metódy optického rozpoznávania znakov. The aim of this bachelor thesis is to design and to implement a module for Named Entity Recognition using rulebased approach. Another part of bachelor thesis describes existing approaches and tools used by Named Entity Recognition task, especially in Czech environment and in the extraction task in scanned documents transformed into text using Optical Character Recognition method.
Collections
- Bakalářské práce - 18102 [1729]