• Aktivní učení pro metody zpracování přirozeného jazyka 

      Autor: Anton Kretov; Vedoucí práce: Drchal Jan; Oponent práce: Schlesinger Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-02-01)
      Zpracování přirozeného jazyka (anglicky Natural Language Processing) je oblastí výzkumu umělé inteligence, která si klade za cíl zpracování textu a extrakci znalostí z něj. Výzkum NLP se v současné době soustřeďuje kolem ...
    • Datová sada pro automatizované ověřování faktů v českém jazyce 

      Autor: Herbert Ullrich; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-06-17)
      Naše práce prozkoumává existující datové sady pro úlohu automatického faktického ověřování textového tvrzení a navrhuje dvě metody jejich získávání v Českém jazyce. Nejprve předkládá rozsáhlý dataset FEVER CS se 127K ...
    • Kontextové reprezentace pro detekci anomálií v souborech logů 

      Autor: Prokop Černý; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-06-15)
      Detekce anomálií v datech logů z velkých počítačových systémů je v posledních letech oblastí rostoucího významu. Logy jakožto textová data musí být nejdříve převedeny (embedovány) na jejich vektorové reprezentace (embeddingy) ...
    • Kontextové reprezentace pro predikce založené souborech logů 

      Autor: Petra Vaňková; Vedoucí práce: Drchal Jan; Oponent práce: Šír Gustav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-08-31)
      Kontextové reprezentace (embeddingy) se staly důležitou součástí přirozeného zpracování jazyka (NLP), neboť umožňují zachycení informace o daném slově v kontextu celé sekvence textu. Současně nejmodernější technologie na ...
    • Metody document retrieval nad českými texty vhodné pro zpracování dlouhých vstupů 

      Autor: Alexander Gažo; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-08-31)
      Úloha vyhľadávania dokumentov (document retrieval) je dobre známy problém nájdenia relevantnej podmnožiny dokumentov k vyhľadávanemu dotazu. Nedávny pokrok v oblasti spracovania prirodzeného jazyka (NLP), konkrétne ...
    • Metody document retrieval pro ověřování faktů 

      Autor: Martin Rýpar; Vedoucí práce: Drchal Jan; Oponent práce: Kordík Pavel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-06-15)
      Tato práce se zabývá přístupy pro vyhledávání dokumentů. Primárně se zaměřuje na metody hlubokého vyhledávání s využitím jazykových modelů a jejich srovnání s tradičními TF-IDF a BM25 modely. Modely jsou zkoumány v doméně ...
    • Sémantické shlukování dat z Twitteru 

      Autor: Jan Petrov; Vedoucí práce: Drchal Jan; Oponent práce: Kubalík Jiří
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-06-08)
      Zabýváme se úlohou sémantického shlukování na podkladě 203K tweetů zveřejněných na Twitteru v českém jazyce. Zkoumáme modely neuronových sítí pro převod textových dat do vektorů nesoucích sémantickou informaci. Vyvinuli ...