Now showing items 1-3 of 3

    • Český korpus pro velký jazykový model 

      Author: Tommaso Gargiani; Supervisor: Šedivý Jan; Opponent: Král Luboš
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-18)
      Tato práce představuje vývoj největšího českého korpusu pro trénování velkých jazykových modelů, jenž obsahuje 167 miliard tokenů. Jeho rozmanité zdroje dat zajišťují komplexní pokrytí českého jazyka. Ke zvýšení kvality ...
    • Dataset normálního, škodlivého, útočného a ostatního síťového provozu v reálné síti 

      Author: Štěpán Bendl; Supervisor: García Sebastián; Opponent: Hynek Karel
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-13)
      Vzhledem k rostoucímu využívání technologií a zvyšujícímu se počtu kybernetických útoků je nezbytné mít k dispozici robustní a reprezentativní bezpečnostní datasety. Tyto datasety jsou klíčové pro získání informací, které ...
    • Detekce propagandistických článků podle šíření na internetu 

      Author: Ondřej Bouček; Supervisor: García Sebastián; Opponent: Catania Carlos
      (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-06-08)
      Tato práce navrhuje nový přístup k rozpoznávání výpočetní propagandy. Zatímco předchozí výzkum v této oblasti se zaměřuje buď na analýzu obsahu nebo na identifikaci škodlivých agentů na sociálních sítích, tato práce se ...