• Český korpus pro velký jazykový model 

      Autor: Tommaso Gargiani; Vedoucí práce: Šedivý Jan; Oponent práce: Král Luboš
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-18)
      Tato práce představuje vývoj největšího českého korpusu pro trénování velkých jazykových modelů, jenž obsahuje 167 miliard tokenů. Jeho rozmanité zdroje dat zajišťují komplexní pokrytí českého jazyka. Ke zvýšení kvality ...
    • Optimalizace LLM agentů pro analýzu tabulkových dat: Integrace LoRA pro zvýšení kvality 

      Autor: Mikhail Poludin; Vedoucí práce: Šedivý Jan; Oponent práce: Král Luboš
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-12)
      Tato práce se zabývá problematikou analýzy tabulkových dat pomocí přirozeného jazyka se zaměřením na využití velkých jazykových modelů (LLM). Obsáhlý přehled literatury se zabývá různými aspekty LLM, včetně jejich ...