Zobrazit minimální záznam

Classification of Fake News in the Media/Social media Ecosystem



dc.contributor.advisorSmítková Janků Ladislava
dc.contributor.authorJan Flajžík
dc.date.accessioned2024-06-19T09:52:05Z
dc.date.available2024-06-19T09:52:05Z
dc.date.issued2024-06-14
dc.identifierKOS-1180078448705
dc.identifier.urihttp://hdl.handle.net/10467/115641
dc.description.abstractRychlý vývoj v oblasti online technologií umožňuje lidem sdílet informace rychleji než kdykoli před tím. To s sebou nese riziko šíření manipulativních zpráv, které mohou negativně ovlivnit společnost. Tato bakalářská práce se zabývá klasifikací fake news v online prostoru z pohledu zpracování přirozeného jazyka (NLP). V rámci této práce byly vytvořeny dva nové datasety za použítí online databází fake news, přičemž jeden obsahuje shrnutí fake news článků v angličtině a druhý je tvořen především řetězovými emaily v češtině. Tyto datasety byly doplněny o dva již existující datasety a všechny byly použity k provedení expermerimentů s mnoha různými metodami předzpracování textu. Ke klasifikaci byly využity dva modely strojového učení, Naivní Bayes a náhodný les a dvě architektury neuronové sítě, konvoluční neurovová síť (CNN) a LSTM. Nejvyšších výsledků na již existujícím datasetu dosáhla CNN architektura s klasifikační přesnosti 97 %, zatímco nejvyšších výsledků na nově vytvořeném dosáhla LSTM architektura s přesností 95 %.cze
dc.description.abstractThe rapid development of online technologies allows people to spread information faster than ever before. This carries the risk of spreading manipulative information that can negatively impact society. The focus of this thesis is the classification of fake news in the media ecosystem from the perspective of natural language processing (NLP). Two brand-new fake news datasets were created using online fake news databases, with the English one made up of short summaries of fake news articles and the Czech one consisting mainly of chain letters. These two datasets and two more existing datasets were used for performing experiments with many text preprocessing methods. Two machine learning classifiers were used for experiments: Naive Bayes and random forest, and two neural network architectures: convolutional neural network (CNN) and LSTM. The CNN attained the highest classification accuracy of 97% on an already-made dataset, whereas the best results on a self-obtained dataset attained the LSTM with 95% accuracy.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectfake newscze
dc.subjectdezinformacecze
dc.subjectsociální sítěcze
dc.subjectřetězové emailycze
dc.subjectzpracování přirozeného jazykacze
dc.subjectklasifikace textucze
dc.subjectstrojové učenícze
dc.subjectneuronové sítěcze
dc.subjectfake newseng
dc.subjectdisinformationeng
dc.subjectsocial mediaeng
dc.subjectchain letterseng
dc.subjectnatural language processingeng
dc.subjecttext classificationeng
dc.subjectmachine learningeng
dc.subjectneural networkseng
dc.titleClassification of Fake News in the Media/Social media Ecosystemcze
dc.titleClassification of Fake News in the Media/Social media Ecosystemeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.date.accepted2024-06-19
dc.contributor.refereeSurynek Pavel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatika, platnost do 2024cze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam