Automatické pojmenovávání skupin slov

Effenberger Jan

Automatic naming of groups of words

Typ dokumentu

diplomová práce
master thesis

Autor

Effenberger Jan

Vedoucí práce

Jiřina Marcel

Oponent práce

Špaček Petr

Studijní obor

Webové a softwarové inženýrství

Studijní program

Informatika

Instituce přidělující hodnost

katedra softwarového inženýrství

Práva

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Zobrazit celý záznam

Abstrakt

Tato práce řeší vývoj aplikace pro automatické pojmenovávání skupin slov za pomoci externích databází znalostí. V práci analyzuji možnosti popisování a běžně používané metody pro popisování. Pro návrh aplikace jsem využil praktické zkušenosti se zaměřením na další rozšiřitelnost a rozvoj. Jako externí databáze jsem v práci využil WordNet a Microsoft Concept Graph a jako programovací jazyk jsem použil jazyk Java. Podařilo se mi vytvořit takovou aplikaci, která umožňuje snadnou změnu popisovacího algoritmu a jiných částí, což je hlavním přínosem práce, a zároveň jsem sestavil dva popisovací algoritmy -- každý pro jednu databázi znalostí. Výsledky popisování se v rámci funkčního testování vzhledem ke kvalitě vstupních dat ukázaly jako adekvátní a uspokojivé.

This work solves the development of application for automatic cluster labeling, using external databases of knowledge. In my thesis I analyze the possibilities of description and commonly used methods for the cluster labeling. I used the practical experience with the focus on further expandability and development. As an external database, I used WordNet and Microsoft Concept Graph at work, and I used Java as a programming language. I managed to create an application that makes it easy to change the labeling algorithm and other parts, which is the main benefit of my work, and I also put together two labeling algorithms -- each for one knowledge base. The results of the labeling in the functional testing proved to be adequate and satisfactory with respect to the quality of the input data.