Classification of Fake News in the Media/Social media Ecosystem
Classification of Fake News in the Media/Social media Ecosystem
Type of document
bakalářská prácebachelor thesis
Author
Jan Flajžík
Supervisor
Smítková Janků Ladislava
Opponent
Surynek Pavel
Field of study
Znalostní inženýrstvíStudy program
Informatika, platnost do 2024Institutions assigning rank
katedra aplikované matematikyDefended
2024-06-19Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Rychlý vývoj v oblasti online technologií umožňuje lidem sdílet informace rychleji než kdykoli před tím. To s sebou nese riziko šíření manipulativních zpráv, které mohou negativně ovlivnit společnost. Tato bakalářská práce se zabývá klasifikací fake news v online prostoru z pohledu zpracování přirozeného jazyka (NLP). V rámci této práce byly vytvořeny dva nové datasety za použítí online databází fake news, přičemž jeden obsahuje shrnutí fake news článků v angličtině a druhý je tvořen především řetězovými emaily v češtině. Tyto datasety byly doplněny o dva již existující datasety a všechny byly použity k provedení expermerimentů s mnoha různými metodami předzpracování textu. Ke klasifikaci byly využity dva modely strojového učení, Naivní Bayes a náhodný les a dvě architektury neuronové sítě, konvoluční neurovová síť (CNN) a LSTM. Nejvyšších výsledků na již existujícím datasetu dosáhla CNN architektura s klasifikační přesnosti 97 %, zatímco nejvyšších výsledků na nově vytvořeném dosáhla LSTM architektura s přesností 95 %. The rapid development of online technologies allows people to spread information faster than ever before. This carries the risk of spreading manipulative information that can negatively impact society. The focus of this thesis is the classification of fake news in the media ecosystem from the perspective of natural language processing (NLP). Two brand-new fake news datasets were created using online fake news databases, with the English one made up of short summaries of fake news articles and the Czech one consisting mainly of chain letters. These two datasets and two more existing datasets were used for performing experiments with many text preprocessing methods. Two machine learning classifiers were used for experiments: Naive Bayes and random forest, and two neural network architectures: convolutional neural network (CNN) and LSTM. The CNN attained the highest classification accuracy of 97% on an already-made dataset, whereas the best results on a self-obtained dataset attained the LSTM with 95% accuracy.
Collections
- Bakalářské práce - 18105 [369]
Related items
Showing items related by title, author, creator and subject.
-
Knihovna funkcí pro počítač RASPBERRY PI
Author: Procházka Tomáš; Supervisor: Kubalík Pavel; Opponent: Vaňát Tomáš
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-08-04)Tato diplomová práce se zabývá vytvořením knihovny pro ovládání jednotlivých periférií počítače Raspberry PI bez použití operačního systému. Důraz je kladen hlavně na ovládání univerzálních vstupů a výstupů, rozhraní UART, ... -
Jedinec a jeho psychologická proměna v prostředí moderních médií
Author: Voděra Kamil; Supervisor: Dobrovská Dana; Opponent: Krejčí Pavel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2015-05-04)Bakalářská práce Jedinec a jeho psychologická proměna v prostředí moderních médií se zabývá problematikou vlivu médií a masové komunikace na žáky SŠ a úrovní jejich mediální gramotnosti. Teoretická část práce pojednává o ... -
Public relations ve společnosti EUROVIA CS a.s.
Author: Rosová Michaela; Supervisor: Jílková Petra; Opponent: Kohoutová Erika
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2018-01-12)Bakalářská práce na téma Public Relations ve společnosti EUROVIA CS a.s. se bude zabývat využíváním PR v dané organizaci, důraz bude kladen na krizovou a mediální komunikaci. Tyto dvě oblasti budou analyzovány. Dále je ...