Rozpoznávání pojmenovaných entit s pomocí rekurentních neuronových sítí
Named Entity Recognition Using Recurrent Neural Networks
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Nguyen Hoang Long
Vedoucí práce
Pichl Jan
Oponent práce
Hajič Jan
Studijní obor
Informatika a počítačové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Rozpoznávání pojmenovaných entit je podúloha ve vyhledávání strukturovaných informací. Jedná se o klasifikaci slov ve větě, které reprezentují entity s vlastním jménem, jako na příklad osoby, organizace nebo lokace. Rozpoznávání entit se často využívá v automatickém odpovídání na otázky. Cílem této práce je rešerše a implementace systému pro rozpoznávání pojmenovaných en-tit na českém (Czech Named Entity Corpus 2.0) a následně anglickém (ConLL2003) datasetu. Bude provedeno několik experimentů s běžnými algoritmy na klasifikaci sekvencí (Condi-tional Random Fields), které vyžadují ruční tvorbu příznaků, a umělými neuronovými sítěmi, které se reprezentaci dat učí samy. Named entity recognition is a subtask in information retrieval, where we look for entities and objects that can be denoted by a proper name, such as persons, organizations or locations. The results are often used in a pipeline, such as question answering or entity linking. The aim of this work is to research and implement a named entity recognition system on the Czech Named Entity Corpus (CNEC 2.0) and CoNLL2003 dataset. We will do several experiments using standard algorithms for sequence labelling (Conditional Random Fields) with linguistic features extracted from literature and several neural network architectures which operate on raw data.
Kolekce
- Bakalářské práce - 13133 [777]