Zobrazit minimální záznam

Tracking Emerging Topics on Social Media



dc.contributor.advisorDrchal Jan
dc.contributor.authorDiana Korladinova
dc.date.accessioned2025-06-19T23:01:21Z
dc.date.available2025-06-19T23:01:21Z
dc.date.issued2025-06-19
dc.identifierKOS-1246385724605
dc.identifier.urihttp://hdl.handle.net/10467/123916
dc.description.abstractRozmach sociálních médií z nich učinil dominantní zdroj informací a klíčovou platformu pro veřejnou diskusi, ale zároveň také prostředek pro šíření dezinformací a dalších škodlivých aktivit. Tato práce se zaměřuje na zásadní potřebu sledovat vznikající témata a jejich vývoj v čase na těchto platformách, zejména s ohledem na aplikace v oblasti kybernetické bezpečnosti zaměřené na detekci falešných zpráv a škodlivých narativů. Práce má dva hlavní přínosy: vytvoření nových a aktuálních datasetů příspěvků ze sociálních sítí Threads, Mastodon a Bluesky, pečlivě předzpracovaných pro účely časové analýzy. Za druhé rozsáhlou empirickou analýzu čtyř technik pro časovou analýzu témat, zahrnující implementaci a hodnocení statistických metod, jako je NMF s časovou regularizací, a sémantických přístupů, jako je BERTopic, implementace modelu NetDTM a vytvořená od základu upravená verze algoritmu Spatio-Temporal DBSCAN (ST-DBSCAN) využívající sémantickou podobnost na základě textových embeddingů. Klíčovým přínosem je komparativní rámec umožňující vizuální a kvalitativní hodnocení vývoje témat napříč metodami, přičemž důraz je kladen na interpretovatelnost, reprezentaci a časovou koherenci. Výsledkem je interaktivní vizualizační nástroj podporující zkoumání životního cyklu témat.cze
dc.description.abstractThe proliferation of social media has made it a dominant source of information and a key platform for public discourse, but also a conduit for misinformation and other malicious activities. This thesis addresses the critical need for ways to track emerging topics and their evolution over time on these platforms, particularly for cybersecurity applications aimed at detecting fake news and harmful narratives. The work encompasses two primary contributions: first, the construction of novel, contemporary datasets of social media posts from Threads, Mastodon, and Bluesky meticulously preprocessed for temporal analysis. Second, a comprehensive empirical exploration of four techniques for temporal topic analysis including the implementation and evaluation of statistical methods like Non-Negative Matrix Factorization (NMF) with Temporal Regularization and semantical approaches such as BERTopic, a from-scratch implementation of the Network Dynamic Topic Model (NetDTM), and an adapted Spatio-Temporal DBSCAN (ST-DBSCAN) using semantic similarity. A key contribution is a comparative framework that enables visual and qualitative assessment of topic dynamics across methods, with emphasis being placed on interpretability, representation, and temporal coherence, culminating in an interactive visualization tool that supports examination of topic lifecycles.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectčasové modelování tématcze
dc.subjectčasová analýza sociálních médiícze
dc.subjectdetekce dynamických tématcze
dc.subjectNMF s časovou regularizacícze
dc.subjectBERTopiccze
dc.subjectNetDTMcze
dc.subjectST-DBSCANcze
dc.subjectsémantické shlukovánícze
dc.subjectvizualizace vývoje tématcze
dc.subjecttemporal topic modellingeng
dc.subjectsocial media temporal analysiseng
dc.subjectdynamic topic detectioneng
dc.subjectNMF with temporal regularizationeng
dc.subjectBERTopiceng
dc.subjectNetDTMeng
dc.subjectST-DBSCANeng
dc.subjectsemantic clusteringeng
dc.subjecttopic evolution visualizationeng
dc.titleSledování vzniku a vývoje témat na sociálních sítíchcze
dc.titleTracking Emerging Topics on Social Mediaeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeKubalík Jiří
theses.degree.disciplineKybernetická bezpečnostcze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam