Sledování vzniku a vývoje témat na sociálních sítích
Tracking Emerging Topics on Social Media
Typ dokumentu
diplomová prácemaster thesis
Autor
Diana Korladinova
Vedoucí práce
Drchal Jan
Oponent práce
Kubalík Jiří
Studijní obor
Kybernetická bezpečnostStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Rozmach sociálních médií z nich učinil dominantní zdroj informací a klíčovou platformu pro veřejnou diskusi, ale zároveň také prostředek pro šíření dezinformací a dalších škodlivých aktivit. Tato práce se zaměřuje na zásadní potřebu sledovat vznikající témata a jejich vývoj v čase na těchto platformách, zejména s ohledem na aplikace v oblasti kybernetické bezpečnosti zaměřené na detekci falešných zpráv a škodlivých narativů. Práce má dva hlavní přínosy: vytvoření nových a aktuálních datasetů příspěvků ze sociálních sítí Threads, Mastodon a Bluesky, pečlivě předzpracovaných pro účely časové analýzy. Za druhé rozsáhlou empirickou analýzu čtyř technik pro časovou analýzu témat, zahrnující implementaci a hodnocení statistických metod, jako je NMF s časovou regularizací, a sémantických přístupů, jako je BERTopic, implementace modelu NetDTM a vytvořená od základu upravená verze algoritmu Spatio-Temporal DBSCAN (ST-DBSCAN) využívající sémantickou podobnost na základě textových embeddingů. Klíčovým přínosem je komparativní rámec umožňující vizuální a kvalitativní hodnocení vývoje témat napříč metodami, přičemž důraz je kladen na interpretovatelnost, reprezentaci a časovou koherenci. Výsledkem je interaktivní vizualizační nástroj podporující zkoumání životního cyklu témat. The proliferation of social media has made it a dominant source of information and a key platform for public discourse, but also a conduit for misinformation and other malicious activities. This thesis addresses the critical need for ways to track emerging topics and their evolution over time on these platforms, particularly for cybersecurity applications aimed at detecting fake news and harmful narratives. The work encompasses two primary contributions: first, the construction of novel, contemporary datasets of social media posts from Threads, Mastodon, and Bluesky meticulously preprocessed for temporal analysis. Second, a comprehensive empirical exploration of four techniques for temporal topic analysis including the implementation and evaluation of statistical methods like Non-Negative Matrix Factorization (NMF) with Temporal Regularization and semantical approaches such as BERTopic, a from-scratch implementation of the Network Dynamic Topic Model (NetDTM), and an adapted Spatio-Temporal DBSCAN (ST-DBSCAN) using semantic similarity. A key contribution is a comparative framework that enables visual and qualitative assessment of topic dynamics across methods, with emphasis being placed on interpretability, representation, and temporal coherence, culminating in an interactive visualization tool that supports examination of topic lifecycles.
Kolekce
- Diplomové práce - 13136 [966]