Design of a Module for Information Extraction from Documents

Návrh modulu pro extrakci údajů z dokumentů

Supervisors

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Date of defense

2015-06-16

Research Projects

Organizational Units

Journal Issue

Abstract

Obsahom bakalárskej práce je návrh a implementácia modulu na rozpoznávanie pomenovaných entít pomocou pravidlového prístupu. Bakalárska práca tiež ponúka prehľad využívaných prístupov a nástrojov, najmä v českom prostredí a pri extrahovaní entít z naskenovaných dokumentov, prevedných pomocou metódy optického rozpoznávania znakov.

The aim of this bachelor thesis is to design and to implement a module for Named Entity Recognition using rulebased approach. Another part of bachelor thesis describes existing approaches and tools used by Named Entity Recognition task, especially in Czech environment and in the extraction task in scanned documents transformed into text using Optical Character Recognition method.

Description

Citation

Underlying research data set URL

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Endorsement

Review

Supplemented By

Referenced By