Topic Modeling for Corpus of Czech Verse

dc.contributor.advisorFriedjungová Magda
dc.contributor.authorAnna Tesaříková
dc.description.abstractTato bakalářská práce zkoumá současné metody pro modelování témat s důrazem na jejich využití v modelování témat poezie. Metody jsou aplikovány na Korpus českého verše. Tento korpus obsahuje 1 305 básnických sbírek z 19. a počátku 20. století, které jsou lemmatizované a foneticky, morfologicky, metricky a stroficky anotované. Práce vyhodnocuje výsledky jednotlivých metod a vzájemně je porovnává.cze
dc.description.abstractThis bachelor thesis surveys state-of-the-art methods of topic modeling with an emphasis on their use in topic modeling of poetry. The methods are applied on the Corpus of Czech Verse. This corpus contains 1,305 collections of poetry from the 19th and the beginning of 20th century which are lemmatized and annotated phonetically, morphologically, metrically, and strophically. The thesis evaluates the results of the methods and compares them with each other.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectmodelování tématcze
dc.subjectčeský jazykcze
dc.subjectzpracování přirozeného jazykacze
dc.subjectstrojové učenícze
dc.subjecttopic modelingeng
dc.subjectCzech languageeng
dc.subjectnatural language processingeng
dc.subjectmachine learningeng
dc.titleModelování témat české poeziecze
dc.titleTopic Modeling for Corpus of Czech Verseeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeKlouda Karel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatika 2009cze

