Zobrazit minimální záznam

Processing streams of short texts in real time



dc.contributor.advisorKuchař Jaroslav
dc.contributor.authorJakub Hynek
dc.date.accessioned2020-09-04T13:54:58Z
dc.date.available2020-09-04T13:54:58Z
dc.date.issued2020-08-27
dc.identifierKOS-987296862605
dc.identifier.urihttp://hdl.handle.net/10467/90114
dc.description.abstractPráce se zabývá zpracováním komentářů u on-line živých vysílání pro usnadnění interakce. Je cílem formou experimentu prozkoumat a vyzkoušet současné možnosti shlukování proudů textu. Byla provedena rešerše existujících algortimů a implementací a na ní navazující řešení, kde předzpracování textů je realizováno v jazyce python za použití knihoven Gensim a NLTK a shlukování textů realizované v javovém frameworku pro strojové učení nad toky dat MOA.cze
dc.description.abstractTopic of this thesis is processing of on-line live streams comments to enable better interaction. The focus is to do a research of existing stream clustering algorithms and experimentally try them on real data. In the thesis is a research of existing algorithms and implementations and a solution, where text is preprocessed in programming language python with the use of libraries NLTK and Gensim and clustering performed in java framework for stream learning MOA.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectmachine learningcze
dc.subjectkrátké textycze
dc.subjectshlukovánícze
dc.subjecttokcze
dc.subjectproudcze
dc.subjectmachine learningeng
dc.subjectshort texteng
dc.subjectclusteringeng
dc.subjectstreameng
dc.titleZpracování toků krátkých textů v reálném časecze
dc.titleProcessing streams of short texts in real timeeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeHoleňa Martin
theses.degree.disciplineTeoretická informatikacze
theses.degree.grantorkatedra teoretické informatikycze
theses.degree.programmeInformatika 2018 (magisterská)cze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam