Design of a Module for Information Extraction from Documents
Návrh modulu pro extrakci údajů z dokumentů
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
2015-06-16
Abstract
Obsahom bakalárskej práce je návrh a implementácia modulu na rozpoznávanie pomenovaných entít pomocou pravidlového prístupu. Bakalárska práca tiež ponúka prehľad využívaných prístupov a nástrojov, najmä v českom prostredí a pri extrahovaní entít z naskenovaných dokumentov, prevedných pomocou metódy optického rozpoznávania znakov.
The aim of this bachelor thesis is to design and to implement a module for Named Entity Recognition using rulebased approach. Another part of bachelor thesis describes existing approaches and tools used by Named Entity Recognition task, especially in Czech environment and in the extraction task in scanned documents transformed into text using Optical Character Recognition method.
The aim of this bachelor thesis is to design and to implement a module for Named Entity Recognition using rulebased approach. Another part of bachelor thesis describes existing approaches and tools used by Named Entity Recognition task, especially in Czech environment and in the extraction task in scanned documents transformed into text using Optical Character Recognition method.
Description
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.