Rozpoznávání pojmenovaných entit s pomocí rekurentních neuronových sítí
Named Entity Recognition Using Recurrent Neural Networks
dc.contributor.advisor | Pichl Jan | |
dc.contributor.author | Nguyen Hoang Long | |
dc.date.accessioned | 2017-06-07T15:54:06Z | |
dc.date.available | 2017-06-07T15:54:06Z | |
dc.date.issued | 2017-05-26 | |
dc.identifier | KOS-587864643805 | |
dc.identifier.uri | http://hdl.handle.net/10467/69368 | |
dc.description.abstract | Rozpoznávání pojmenovaných entit je podúloha ve vyhledávání strukturovaných informací. Jedná se o klasifikaci slov ve větě, které reprezentují entity s vlastním jménem, jako na příklad osoby, organizace nebo lokace. Rozpoznávání entit se často využívá v automatickém odpovídání na otázky. Cílem této práce je rešerše a implementace systému pro rozpoznávání pojmenovaných en-tit na českém (Czech Named Entity Corpus 2.0) a následně anglickém (ConLL2003) datasetu. Bude provedeno několik experimentů s běžnými algoritmy na klasifikaci sekvencí (Condi-tional Random Fields), které vyžadují ruční tvorbu příznaků, a umělými neuronovými sítěmi, které se reprezentaci dat učí samy. | cze |
dc.description.abstract | Named entity recognition is a subtask in information retrieval, where we look for entities and objects that can be denoted by a proper name, such as persons, organizations or locations. The results are often used in a pipeline, such as question answering or entity linking. The aim of this work is to research and implement a named entity recognition system on the Czech Named Entity Corpus (CNEC 2.0) and CoNLL2003 dataset. We will do several experiments using standard algorithms for sequence labelling (Conditional Random Fields) with linguistic features extracted from literature and several neural network architectures which operate on raw data. | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | rozpoznávání pojmenovaných entit,klasifikace sekvencí,pojmenované entity,rekurentní neuronové sítě | cze |
dc.subject | named entity recognition,sequence labelling,named entities,recurrent neural networks | eng |
dc.title | Rozpoznávání pojmenovaných entit s pomocí rekurentních neuronových sítí | cze |
dc.title | Named Entity Recognition Using Recurrent Neural Networks | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | ||
dc.contributor.referee | Hajič Jan | |
theses.degree.discipline | Informatika a počítačové vědy | cze |
theses.degree.grantor | katedra kybernetiky | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 13133 [778]