Vyhodnocení kvality datových sad síťového provozu
Quality Evaluation of Network Traffic Datasets
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Samuel Harčár
Vedoucí práce
Soukup Dominik
Oponent práce
Plný Richard
Studijní obor
Umělá inteligence 2021Studijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Táto bakalárska práca sa zaoberá problematikou vytvárania štruktúrovaných analýz dátových súborov sieťovej prevádzky. Dátový súbor sieťovej prevádzky vzniká zaznamenávaním dát, ktoré prechádzajú cez určitý monitorovací bod v rámci počítačovej siete. Takto získané dátové súbory sú z pravidla popísané ich autormi prostredníctvom výskumného článku. Tento článok je citovaný v článkoch iných výskumníkov, ktorí skúmaný dátový súbor použili. Spomenuté články predstavujú hodnotný zdroj informácií, z ktorého je možné pri vytvá-raní štruktúrovanej analýzy čerpať. Prvým cieľom práce je preskúmať poten-ciál využitia veľkých jazykových modelov (LLM) pre extrahovanie informácií z textu spomínaných dokumentov za účelom vytvorenia štruktúrovanej analýzy dátového súboru. Druhým cieľom je vytvorenie nástroja, ktorý automatizovane vygeneruje štruktúrovanú analýzu dátového súboru s využitím LLM a doku-mentov, ktoré dátový súbor popisujú. Takto vygenerovaná analýza môže byť podkladom, z ktorého môže výskumník čerpať pri vytváraní konečnej podoby štruktúrovanej analýzy. This bachelors thesis addresses the problem of creating structured analyses of network traffic datasets. A network traffic dataset is created by recording data that passes through a specific monitoring point within a computer network. Such datasets are typically described by their authors through a research article. This article is cited in other researchers articles who have used the examined dataset. The mentioned articles represent a valuable source of information that can be utilized when creating a structured analysis. The first objective of this thesis is to explore the potential of using large language models (LLMs) in perfroming information extraction from the text of the mentioned documents with the goal of creating a structured analysis of the dataset. The second objective is to develop a tool that automatically generates a structured analysis of a dataset using LLM and the documents describing the dataset. The generated analysis can serve as a basis from which a researcher can draw when creating the final version of the structured analysis.
Kolekce
- Bakalářské práce - 18105 [370]
