Classification of Fake News in the Media/Social media Ecosystem
Classification of Fake News in the Media/Social media Ecosystem
dc.contributor.advisor | Smítková Janků Ladislava | |
dc.contributor.author | Jan Flajžík | |
dc.date.accessioned | 2024-06-19T09:52:05Z | |
dc.date.available | 2024-06-19T09:52:05Z | |
dc.date.issued | 2024-06-14 | |
dc.identifier | KOS-1180078448705 | |
dc.identifier.uri | http://hdl.handle.net/10467/115641 | |
dc.description.abstract | Rychlý vývoj v oblasti online technologií umožňuje lidem sdílet informace rychleji než kdykoli před tím. To s sebou nese riziko šíření manipulativních zpráv, které mohou negativně ovlivnit společnost. Tato bakalářská práce se zabývá klasifikací fake news v online prostoru z pohledu zpracování přirozeného jazyka (NLP). V rámci této práce byly vytvořeny dva nové datasety za použítí online databází fake news, přičemž jeden obsahuje shrnutí fake news článků v angličtině a druhý je tvořen především řetězovými emaily v češtině. Tyto datasety byly doplněny o dva již existující datasety a všechny byly použity k provedení expermerimentů s mnoha různými metodami předzpracování textu. Ke klasifikaci byly využity dva modely strojového učení, Naivní Bayes a náhodný les a dvě architektury neuronové sítě, konvoluční neurovová síť (CNN) a LSTM. Nejvyšších výsledků na již existujícím datasetu dosáhla CNN architektura s klasifikační přesnosti 97 %, zatímco nejvyšších výsledků na nově vytvořeném dosáhla LSTM architektura s přesností 95 %. | cze |
dc.description.abstract | The rapid development of online technologies allows people to spread information faster than ever before. This carries the risk of spreading manipulative information that can negatively impact society. The focus of this thesis is the classification of fake news in the media ecosystem from the perspective of natural language processing (NLP). Two brand-new fake news datasets were created using online fake news databases, with the English one made up of short summaries of fake news articles and the Czech one consisting mainly of chain letters. These two datasets and two more existing datasets were used for performing experiments with many text preprocessing methods. Two machine learning classifiers were used for experiments: Naive Bayes and random forest, and two neural network architectures: convolutional neural network (CNN) and LSTM. The CNN attained the highest classification accuracy of 97% on an already-made dataset, whereas the best results on a self-obtained dataset attained the LSTM with 95% accuracy. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | fake news | cze |
dc.subject | dezinformace | cze |
dc.subject | sociální sítě | cze |
dc.subject | řetězové emaily | cze |
dc.subject | zpracování přirozeného jazyka | cze |
dc.subject | klasifikace textu | cze |
dc.subject | strojové učení | cze |
dc.subject | neuronové sítě | cze |
dc.subject | fake news | eng |
dc.subject | disinformation | eng |
dc.subject | social media | eng |
dc.subject | chain letters | eng |
dc.subject | natural language processing | eng |
dc.subject | text classification | eng |
dc.subject | machine learning | eng |
dc.subject | neural networks | eng |
dc.title | Classification of Fake News in the Media/Social media Ecosystem | cze |
dc.title | Classification of Fake News in the Media/Social media Ecosystem | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | 2024-06-19 | |
dc.contributor.referee | Surynek Pavel | |
theses.degree.discipline | Znalostní inženýrství | cze |
theses.degree.grantor | katedra aplikované matematiky | cze |
theses.degree.programme | Informatika, platnost do 2024 | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18105 [369]