Analýza sentimentu recenzí v českém jazyce
Product review sentiment analysis in the Czech language
dc.contributor.advisor | Vašata Daniel | |
dc.contributor.author | Lukáš Langr | |
dc.date.accessioned | 2019-06-14T22:51:39Z | |
dc.date.available | 2019-06-14T22:51:39Z | |
dc.date.issued | 2019-06-14 | |
dc.identifier | KOS-762877340205 | |
dc.identifier.uri | http://hdl.handle.net/10467/83127 | |
dc.description.abstract | Tato práce poskytuje bližší pohled na současně nejmodernější metody reprezentace dokumentů pro účely analýzy sentimentu. Přestože se mnoho nedávných článků soustředí buď na angličtinu nebo čínštinu, tato práce poskytuje unikátní hodnocení daných metod z pohledu českého jazyka. Převádíme české rezence do různých reprezentací a za pomocí modelů strojového učení na nich provádíme klasifikaci do několika tříd sentimentu. Dosažená přesnost předčila naše očekávání i podobné výzkumné články v českém prostředí používající stejný dataset. Věříme, že tato práce bude základem dalšího rozsáhlejšího výzkumu těchto reprezentací. | cze |
dc.description.abstract | This thesis provides a closer look at the state of the art methods of representing documents for sentiment analysis tasks. As many of the recent articles only focus on either the English or the Chinese language, this thesis provides a unique evaluation of those methods from the perspective of the Czech language. We use various representations on reviews in the Czech language and perform a multiclass sentiment classification via machine learning models. Our achieved accuracy supersedes expectations and similar research articles using the same dataset in the Czech field. We believe this thesis will be a base upon which more extensive research of the possibilities of these representations will be conducted. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | analýza sentimentu | cze |
dc.subject | klasifikace | cze |
dc.subject | strojové učení | cze |
dc.subject | recenze | cze |
dc.subject | word2vec | cze |
dc.subject | BERT | cze |
dc.subject | čeština | cze |
dc.subject | zpracování přirozeného textu | cze |
dc.subject | sentiment analysis | eng |
dc.subject | classification | eng |
dc.subject | machine learning | eng |
dc.subject | reviews | eng |
dc.subject | word2vec | eng |
dc.subject | BERT | eng |
dc.subject | Czech language | eng |
dc.subject | natural language processing | eng |
dc.title | Analýza sentimentu recenzí v českém jazyce | cze |
dc.title | Product review sentiment analysis in the Czech language | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Novák Petr | |
theses.degree.discipline | Znalostní inženýrství | cze |
theses.degree.grantor | katedra aplikované matematiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18105 [244]