Sledování vzniku a vývoje témat na sociálních sítích
Tracking Emerging Topics on Social Media
dc.contributor.advisor | Drchal Jan | |
dc.contributor.author | Diana Korladinova | |
dc.date.accessioned | 2025-06-19T23:01:21Z | |
dc.date.available | 2025-06-19T23:01:21Z | |
dc.date.issued | 2025-06-19 | |
dc.identifier | KOS-1246385724605 | |
dc.identifier.uri | http://hdl.handle.net/10467/123916 | |
dc.description.abstract | Rozmach sociálních médií z nich učinil dominantní zdroj informací a klíčovou platformu pro veřejnou diskusi, ale zároveň také prostředek pro šíření dezinformací a dalších škodlivých aktivit. Tato práce se zaměřuje na zásadní potřebu sledovat vznikající témata a jejich vývoj v čase na těchto platformách, zejména s ohledem na aplikace v oblasti kybernetické bezpečnosti zaměřené na detekci falešných zpráv a škodlivých narativů. Práce má dva hlavní přínosy: vytvoření nových a aktuálních datasetů příspěvků ze sociálních sítí Threads, Mastodon a Bluesky, pečlivě předzpracovaných pro účely časové analýzy. Za druhé rozsáhlou empirickou analýzu čtyř technik pro časovou analýzu témat, zahrnující implementaci a hodnocení statistických metod, jako je NMF s časovou regularizací, a sémantických přístupů, jako je BERTopic, implementace modelu NetDTM a vytvořená od základu upravená verze algoritmu Spatio-Temporal DBSCAN (ST-DBSCAN) využívající sémantickou podobnost na základě textových embeddingů. Klíčovým přínosem je komparativní rámec umožňující vizuální a kvalitativní hodnocení vývoje témat napříč metodami, přičemž důraz je kladen na interpretovatelnost, reprezentaci a časovou koherenci. Výsledkem je interaktivní vizualizační nástroj podporující zkoumání životního cyklu témat. | cze |
dc.description.abstract | The proliferation of social media has made it a dominant source of information and a key platform for public discourse, but also a conduit for misinformation and other malicious activities. This thesis addresses the critical need for ways to track emerging topics and their evolution over time on these platforms, particularly for cybersecurity applications aimed at detecting fake news and harmful narratives. The work encompasses two primary contributions: first, the construction of novel, contemporary datasets of social media posts from Threads, Mastodon, and Bluesky meticulously preprocessed for temporal analysis. Second, a comprehensive empirical exploration of four techniques for temporal topic analysis including the implementation and evaluation of statistical methods like Non-Negative Matrix Factorization (NMF) with Temporal Regularization and semantical approaches such as BERTopic, a from-scratch implementation of the Network Dynamic Topic Model (NetDTM), and an adapted Spatio-Temporal DBSCAN (ST-DBSCAN) using semantic similarity. A key contribution is a comparative framework that enables visual and qualitative assessment of topic dynamics across methods, with emphasis being placed on interpretability, representation, and temporal coherence, culminating in an interactive visualization tool that supports examination of topic lifecycles. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | časové modelování témat | cze |
dc.subject | časová analýza sociálních médií | cze |
dc.subject | detekce dynamických témat | cze |
dc.subject | NMF s časovou regularizací | cze |
dc.subject | BERTopic | cze |
dc.subject | NetDTM | cze |
dc.subject | ST-DBSCAN | cze |
dc.subject | sémantické shlukování | cze |
dc.subject | vizualizace vývoje témat | cze |
dc.subject | temporal topic modelling | eng |
dc.subject | social media temporal analysis | eng |
dc.subject | dynamic topic detection | eng |
dc.subject | NMF with temporal regularization | eng |
dc.subject | BERTopic | eng |
dc.subject | NetDTM | eng |
dc.subject | ST-DBSCAN | eng |
dc.subject | semantic clustering | eng |
dc.subject | topic evolution visualization | eng |
dc.title | Sledování vzniku a vývoje témat na sociálních sítích | cze |
dc.title | Tracking Emerging Topics on Social Media | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Kubalík Jiří | |
theses.degree.discipline | Kybernetická bezpečnost | cze |
theses.degree.grantor | katedra počítačů | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13136 [966]