• Adversarialní útoky na klasifikátory textu 

      Autor: David Herel; Vedoucí práce: Mikolov Tomáš; Oponent práce: Rehák Martin
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-06-07)
      V dnešní době se velká část mezilidské komunikace odehrává na sociálních sítích nebo diskusních fórech. Vzniká tak obrovské množství textových dat, která je často nutné automaticky kontrolovat, klasifikovat a filtrovat ...
    • Aktivní učení pro metody zpracování přirozeného jazyka 

      Autor: Anton Kretov; Vedoucí práce: Drchal Jan; Oponent práce: Schlesinger Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-02-01)
      Zpracování přirozeného jazyka (anglicky Natural Language Processing) je oblastí výzkumu umělé inteligence, která si klade za cíl zpracování textu a extrakci znalostí z něj. Výzkum NLP se v současné době soustřeďuje kolem ...
    • Algoritmy pro extrakci definic v právních předpisech 

      Autor: Jan Hošťálek; Vedoucí práce: Křemen Petr; Oponent práce: Klíma Karel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-18)
      Tato práce představuje inovativní algoritmy a přístupy pro extrakci definic z českých legislativních dokumentů s využitím technologií sémantického webu a velkých jazykových modelů. Zaměřuje se na použitelnost jazykových ...
    • Detekce anomálií z logů 

      Autor: Marek Souček; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2020-09-01)
      Tato diplomová práce se zabývá možností aplikovat nedávné pokroky v oblasti zpracování přirozeného jazyka (NLP) na problém detekce anomálií z logů. Konkrétně zkouší, zda lze použít fastText, jakož to pokročilou metodu NLP ...
    • Detekce dříve ověřených tvrzení 

      Autor: Vít Šenfeld; Vedoucí práce: Drchal Jan; Oponent práce: Mařík Radek
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-15)
      V posledních letech došlo k razantnímu nárůstu počtu publikovaných fake-news. V reakci na tuto skutečnost je cílem této práce podpora stávajicích organizací zabývajích se fact-checkingem, které se v současnosti většinou ...
    • Detekce fake news metodami zpracování přirozeného jazyka 

      Autor: Denis Řeháček; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2020-01-21)
      Tato práce představuje problematiku dezinformací ve světě bohatém na informace. Detekce Fake News (falešných zpráv) byla řešena jako text classification problem. Bylo provedeno více než sto experimentů s cílem nalézt vhodnou ...
    • Kontextové reprezentace pro detekci anomálií v souborech logů 

      Autor: Prokop Černý; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-06-15)
      Detekce anomálií v datech logů z velkých počítačových systémů je v posledních letech oblastí rostoucího významu. Logy jakožto textová data musí být nejdříve převedeny (embedovány) na jejich vektorové reprezentace (embeddingy) ...
    • Kontextové reprezentace pro predikce založené souborech logů 

      Autor: Petra Vaňková; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-08-31)
      Kontextové reprezentace (embeddingy) se staly důležitou součástí přirozeného zpracování jazyka (NLP), neboť umožňují zachycení informace o daném slově v kontextu celé sekvence textu. Současně nejmodernější technologie na ...
    • Metody document retrieval nad českými texty vhodné pro zpracování dlouhých vstupů 

      Autor: Alexander Gažo; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-08-31)
      Úloha vyhľadávania dokumentov (document retrieval) je dobre známy problém nájdenia relevantnej podmnožiny dokumentov k vyhľadávanemu dotazu. Nedávny pokrok v oblasti spracovania prirodzeného jazyka (NLP), konkrétne ...
    • Metody document retrieval pro ověřování faktů 

      Autor: Martin Rýpar; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-06-15)
      Tato práce se zabývá přístupy pro vyhledávání dokumentů. Primárně se zaměřuje na metody hlubokého vyhledávání s využitím jazykových modelů a jejich srovnání s tradičními TF-IDF a BM25 modely. Modely jsou zkoumány v doméně ...
    • Metody sumarizace českých textů podporující fakticitu 

      Autor: Marian Krotil; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-12)
      Pokrok ve zpracování přirozeného jazyka byl v posledních letech dosažen díky předtrénování velkých jazykových modelů na rozsáhlých vícejazyčných korpusech, což jim umožnilo zpracovávat texty v méně pokrytých jazycích, jako ...
    • Optimalizace LLM agentů pro analýzu tabulkových dat: Integrace LoRA pro zvýšení kvality 

      Autor: Mikhail Poludin; Vedoucí práce: Šedivý Jan; Oponent práce: Král Luboš
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-12)
      Tato práce se zabývá problematikou analýzy tabulkových dat pomocí přirozeného jazyka se zaměřením na využití velkých jazykových modelů (LLM). Obsáhlý přehled literatury se zabývá různými aspekty LLM, včetně jejich ...
    • Vysvětlování výstupu modelů zpracování přirozeného jazyka pro úlohu ověřování faktů 

      Autor: Eliška Kopecká; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-06-07)
      This thesis explores interpretability methods and the possibilities of their application to natural language processing (NLP) models used within a fact-checking pipeline. More specifically, it focuses on the application ...
    • Získávání kauzálních znalostí z textových dat 

      Autor: Jennifer Za Nzambi; Vedoucí práce: Mikolov Tomáš; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-01-24)
      Sociální sítě představují nedotčenou zlatou žílu, skrývající zásobu veřejných názorů, postojů a emocí. Pokud bychom ji dokázali plně využít, mohlo by to zásadně změnit způsob, jakým jsou veřejné názory shromažďovány a ...
    • Zkvalitňování fakticity generovaných sumarizací 

      Autor: Václav Halama; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-15)
      Tato práce se zabývá abstraktivní a extraktivní sumarizací textu s důrazem na zlepšení faktické kvality generovaných sumarizací. Byly prozkoumány moderní sumarizační metody a metriky na posouzení kvality sumarizací a byla ...