• Český korpus pro velký jazykový model 

      Autor: Tommaso Gargiani; Vedoucí práce: Šedivý Jan; Oponent práce: Král Luboš
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-18)
      Tato práce představuje vývoj největšího českého korpusu pro trénování velkých jazykových modelů, jenž obsahuje 167 miliard tokenů. Jeho rozmanité zdroje dat zajišťují komplexní pokrytí českého jazyka. Ke zvýšení kvality ...
    • Zpracování přirozeného jazyka v medicíně pomocí retrieval augmented generation 

      Autor: Štěpán Bořek; Vedoucí práce: Novák Daniel; Oponent práce: Gabrhelík Roman
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-13)
      Tato práce se zabývá využitím technologie RAG (retrieval-augmented generation) pro zlepšení odpovědí v rozhovorech mezi adiktology a jejich klienty v aplikaci vyvíjené pro Národní linku pro odvykání, kterou vyvíjí náš ...