• Český korpus pro velký jazykový model 

      Autor: Tommaso Gargiani; Vedoucí práce: Šedivý Jan; Oponent práce: Král Luboš
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-18)
      Tato práce představuje vývoj největšího českého korpusu pro trénování velkých jazykových modelů, jenž obsahuje 167 miliard tokenů. Jeho rozmanité zdroje dat zajišťují komplexní pokrytí českého jazyka. Ke zvýšení kvality ...
    • Vliv architektury klasifikačního modelu na detekci anomálií v textu 

      Autor: Tommaso Gargiani; Vedoucí práce: Lorenc Petr; Oponent práce: Kuznetsov Stanislav
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2021-06-03)
      Konverzační agenti pracují v různých prostředích. V open world prostředí hraje důležitou roli jak rozpoznávání předdefinovaných in-domain intentů, tak detekce neznámých out-of-domain anomálií. V této práci zkoumáme různé ...