Hodnocení reakcí čtenářů na obsah mediálních zpráv

Jakub Ambroz

Evaluation of Readers’ Reactions to the Content of Media News

Type of document

bakalářská práce
bachelor thesis

Author

Jakub Ambroz

Supervisor

Mařík Radek

Opponent

Drchal Jan

Field of study

Základy umělé inteligence a počítačových věd

Study program

Otevřená informatika

Institutions assigning rank

katedra kybernetiky

Rights

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Show full item record

Abstract

Tato bakalářská práce poskytuje základní přehled o extrakci dat z webu (web scraping), zpracování přirozeného jazyka (NLP) a analýze sentimentu - se zaměřením na lexikony sentimentu. Byl vytvořen soubor dat s články a jejich komentářovými sekcemi ze stránek www.seznamzpravy.cz a www.idnes.cz. Z datasetu jsme vytvořili vektorové reprezentace pomocí programu Word2vec. Úpravou přístupu založeného na slovníku (dictionary-based approach) jsme zkoumali, zda by tyto vektory mohou být vhodné pro vytváření lexikonů sentimentu. Existující lexikon sentimentu byl použit k analýze sentimentu komentářů k článkům zaměřeným na různá témata. Nakonec jsme zkoumali, zda by reakce na tyto komentáře (lajky, dislajky) mohly být použity k měření sentimentu.

This bachelor's thesis gives a basic overview of web scraping, natural language processing, and sentiment analysis - focusing on sentiment lexicons. A dataset with articles and their comment sections from www.seznamzpravy.cz and www.idnes.cz was created. From the dataset, we created vector representations by Word2vec. By adjusting the dictionary-based approach, we explored if these vectors could be appropriate for creating sentiment lexicons. An existing sentiment lexicon was used to analyze the sentiment of the comments on articles focusing on different topics. Finally, we explored if reactions to these comments (likes, dislikes) could be used to measure sentiment.