Hodnoceni diskusních příspěvků mediálních zpráv
Evaluation of Media News Discussion Posts
dc.contributor.advisor | Mařík Radek | |
dc.contributor.author | Luka Peraica | |
dc.date.accessioned | 2025-06-12T14:52:47Z | |
dc.date.available | 2025-06-12T14:52:47Z | |
dc.date.issued | 2025-06-07 | |
dc.identifier | KOS-1176928179805 | |
dc.identifier.uri | http://hdl.handle.net/10467/123209 | |
dc.description.abstract | Internetové diskuse často přitahují rušivé chování, jako je trolling, jehož cílem je provokovat nebo klamat uživatele. Tato bakalářská práce se zabývá detekcí trollů pomocí metod zpracování přirozeného jazyka (NLP), se zaměřením na komentáře uživatelů českého zpravodajského portálu Novinky.cz. Využívá transformer modely, konkrétně vícejazyčný model BERT, k přiřazení uživatelům kontinuálního skóre trollovitosti, což lépe vystihuje komplexitu online chování oproti tradičnímu binárnímu rozdělení. Model původně trénovaný na vícejazyčných datových sadách překonal tradiční metody, ale narazil na problémy při přenosu znalostí přímo na české komentáře. Další doladění pomocí malé anotované sady českých komentářů významně zvýšilo jeho efektivitu. Práci uzavírá shrnutí silných stránek metody a uznání jejích omezení. | cze |
dc.description.abstract | Online discussions frequently attract disruptive behaviors such as trolling, intended to provoke or mislead users. This bachelor's thesis explores troll detection using Natural Language Processing (NLP), focusing on user comments from the Czech news site Novinky.cz. It employs transformer-based models, specifically multilingual BERT, to assign users a continuous "trolliness" score, rather than only a traditional binary classifications. Initially trained on multilingual datasets, the model outperformed traditional methods but faced challenges transferring knowledge directly to Czech comments. Further fine-tuning with a small annotated dataset of Czech comments significantly improved its effectiveness. The thesis concludes by highlighting the method's strengths and acknowledging limitations. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | online trolling | cze |
dc.subject | Zpracování přirozeného jazyka (NLP) | cze |
dc.subject | Transformer modely | cze |
dc.subject | vícejazyčný BERT | cze |
dc.subject | Strojové učení | cze |
dc.subject | Online trolling | eng |
dc.subject | Natural Language Processing (NLP) | eng |
dc.subject | Transformer models | eng |
dc.subject | Multiligual BERT | eng |
dc.subject | Machine Learning | eng |
dc.title | Hodnoceni diskusních příspěvků mediálních zpráv | cze |
dc.title | Evaluation of Media News Discussion Posts | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | 2025-06-12 | |
dc.contributor.referee | Drchal Jan | |
theses.degree.discipline | Základy umělé inteligence a počítačových věd | cze |
theses.degree.grantor | katedra kybernetiky | cze |
theses.degree.programme | Otevřená informatika | cze |
Files in this item
This item appears in the following Collection(s)
-
Bakalářské práce - 13133 [854]