Untitled

Now showing items 1-3 of 3

Český korpus pro velký jazykový model

Author: Tommaso Gargiani; Supervisor: Šedivý Jan; Opponent: Král Luboš
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2024-06-18)

Tato práce představuje vývoj největšího českého korpusu pro trénování velkých jazykových modelů, jenž obsahuje 167 miliard tokenů. Jeho rozmanité zdroje dat zajišťují komplexní pokrytí českého jazyka. Ke zvýšení kvality ...
Dataset normálního, škodlivého, útočného a ostatního síťového provozu v reálné síti

Author: Štěpán Bendl; Supervisor: García Sebastián; Opponent: Hynek Karel
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-13)

Vzhledem k rostoucímu využívání technologií a zvyšujícímu se počtu kybernetických útoků je nezbytné mít k dispozici robustní a reprezentativní bezpečnostní datasety. Tyto datasety jsou klíčové pro získání informací, které ...
Detekce propagandistických článků podle šíření na internetu

Author: Ondřej Bouček; Supervisor: García Sebastián; Opponent: Catania Carlos
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2022-06-08)

Tato práce navrhuje nový přístup k rozpoznávání výpočetní propagandy. Zatímco předchozí výzkum v této oblasti se zaměřuje buď na analýzu obsahu nebo na identifikaci škodlivých agentů na sociálních sítích, tato práce se ...

Browsing Diplomové práce - 13136 by Subject "dataset"

Český korpus pro velký jazykový model ﻿

Dataset normálního, škodlivého, útočného a ostatního síťového provozu v reálné síti ﻿

Detekce propagandistických článků podle šíření na internetu ﻿

Český korpus pro velký jazykový model

Dataset normálního, škodlivého, útočného a ostatního síťového provozu v reálné síti

Detekce propagandistických článků podle šíření na internetu