Analýza dat pomocí znalostních sítí
Data Analysis using Knowledge Networks
Typ dokumentu
diplomová prácemaster thesis
Autor
Arina Lebedeva
Vedoucí práce
Mařík Radek
Oponent práce
Drchal Jan
Studijní obor
Komunikační sítě a internetStudijní program
Elektronika a komunikaceInstituce přidělující hodnost
katedra telekomunikační technikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zaobírá problematikou tvorby znalostních sítí, konkrétně tvorbou znalostních grafů, jež jsou digitální reprezentací entit reálného světa a vztahů mezi nimi. Teoretická část práce se skládá z popisu procesu tvorby znalostních grafů. V ní jsou rozebrány takové pojmy, jako jsou NLP pipelines, tokenization, POS tagging, NER (Named-entity recognition) a RE (Relation Extraction). Praktická část ukazuje proces tvorby znalostní sítě na reálních datech a demonstruje znalostní graf vygenerovaný z několika tisíc novinářských článků dodaných ústavem formální a aplikované lingvistiky. This thesis concerns itself with the issue of knowledge networks, specifically the creation of knowledge graphs, which are a digital representation of real-world entities and the relationships between them. The theoretical part consists of a description of the process of creating knowledge graphs. It discusses concepts such as NLP pipelines, tokenization, POS tagging, NER (Named-entity recognition) and RE (Relation Extraction). The practical part shows the process of creating a knowledge network from real data and demonstrates a knowledge graph generated from several thousand journalistic articles supplied by the Institute of Formal and Applied Linguistics.
Kolekce
- Diplomové práce - 13132 [275]