Classification of Fake News in the Media/Social media Ecosystem
Classification of Fake News in the Media/Social media Ecosystem
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Jan Flajžík
Vedoucí práce
Smítková Janků Ladislava
Oponent práce
Surynek Pavel
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika, platnost do 2024Instituce přidělující hodnost
katedra aplikované matematikyObhájeno
2024-06-19Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Rychlý vývoj v oblasti online technologií umožňuje lidem sdílet informace rychleji než kdykoli před tím. To s sebou nese riziko šíření manipulativních zpráv, které mohou negativně ovlivnit společnost. Tato bakalářská práce se zabývá klasifikací fake news v online prostoru z pohledu zpracování přirozeného jazyka (NLP). V rámci této práce byly vytvořeny dva nové datasety za použítí online databází fake news, přičemž jeden obsahuje shrnutí fake news článků v angličtině a druhý je tvořen především řetězovými emaily v češtině. Tyto datasety byly doplněny o dva již existující datasety a všechny byly použity k provedení expermerimentů s mnoha různými metodami předzpracování textu. Ke klasifikaci byly využity dva modely strojového učení, Naivní Bayes a náhodný les a dvě architektury neuronové sítě, konvoluční neurovová síť (CNN) a LSTM. Nejvyšších výsledků na již existujícím datasetu dosáhla CNN architektura s klasifikační přesnosti 97 %, zatímco nejvyšších výsledků na nově vytvořeném dosáhla LSTM architektura s přesností 95 %. The rapid development of online technologies allows people to spread information faster than ever before. This carries the risk of spreading manipulative information that can negatively impact society. The focus of this thesis is the classification of fake news in the media ecosystem from the perspective of natural language processing (NLP). Two brand-new fake news datasets were created using online fake news databases, with the English one made up of short summaries of fake news articles and the Czech one consisting mainly of chain letters. These two datasets and two more existing datasets were used for performing experiments with many text preprocessing methods. Two machine learning classifiers were used for experiments: Naive Bayes and random forest, and two neural network architectures: convolutional neural network (CNN) and LSTM. The CNN attained the highest classification accuracy of 97% on an already-made dataset, whereas the best results on a self-obtained dataset attained the LSTM with 95% accuracy.
Kolekce
- Bakalářské práce - 18105 [292]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Knihovna funkcí pro počítač RASPBERRY PI
Autor: Procházka Tomáš; Vedoucí práce: Kubalík Pavel; Oponent práce: Vaňát Tomáš
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-08-04)Tato diplomová práce se zabývá vytvořením knihovny pro ovládání jednotlivých periférií počítače Raspberry PI bez použití operačního systému. Důraz je kladen hlavně na ovládání univerzálních vstupů a výstupů, rozhraní UART, ... -
Jedinec a jeho psychologická proměna v prostředí moderních médií
Autor: Voděra Kamil; Vedoucí práce: Dobrovská Dana; Oponent práce: Krejčí Pavel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2015-05-04)Bakalářská práce Jedinec a jeho psychologická proměna v prostředí moderních médií se zabývá problematikou vlivu médií a masové komunikace na žáky SŠ a úrovní jejich mediální gramotnosti. Teoretická část práce pojednává o ... -
Public relations ve společnosti EUROVIA CS a.s.
Autor: Rosová Michaela; Vedoucí práce: Jílková Petra; Oponent práce: Kohoutová Erika
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2018-01-12)Bakalářská práce na téma Public Relations ve společnosti EUROVIA CS a.s. se bude zabývat využíváním PR v dané organizaci, důraz bude kladen na krizovou a mediální komunikaci. Tyto dvě oblasti budou analyzovány. Dále je ...