Automatické pojmenovávání skupin slov
Automatic naming of groups of words
Typ dokumentu
diplomová prácemaster thesis
Autor
Effenberger Jan
Vedoucí práce
Jiřina Marcel
Oponent práce
Špaček Petr
Studijní obor
Webové a softwarové inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra softwarového inženýrstvíPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce řeší vývoj aplikace pro automatické pojmenovávání skupin slov za pomoci externích databází znalostí. V práci analyzuji možnosti popisování a běžně používané metody pro popisování. Pro návrh aplikace jsem využil praktické zkušenosti se zaměřením na další rozšiřitelnost a rozvoj. Jako externí databáze jsem v práci využil WordNet a Microsoft Concept Graph a jako programovací jazyk jsem použil jazyk Java. Podařilo se mi vytvořit takovou aplikaci, která umožňuje snadnou změnu popisovacího algoritmu a jiných částí, což je hlavním přínosem práce, a zároveň jsem sestavil dva popisovací algoritmy -- každý pro jednu databázi znalostí. Výsledky popisování se v rámci funkčního testování vzhledem ke kvalitě vstupních dat ukázaly jako adekvátní a uspokojivé. This work solves the development of application for automatic cluster labeling, using external databases of knowledge. In my thesis I analyze the possibilities of description and commonly used methods for the cluster labeling. I used the practical experience with the focus on further expandability and development. As an external database, I used WordNet and Microsoft Concept Graph at work, and I used Java as a programming language. I managed to create an application that makes it easy to change the labeling algorithm and other parts, which is the main benefit of my work, and I also put together two labeling algorithms -- each for one knowledge base. The results of the labeling in the functional testing proved to be adequate and satisfactory with respect to the quality of the input data.
Kolekce
- Diplomové práce - 18102 [1006]