Klasifikace síťového provozu pomocí strojového učení
Machine-learning based network traffic classification
Type of document
diplomová prácemaster thesis
Author
Matej Hulák
Supervisor
Hynek Karel
Opponent
Fornůsek Simona
Field of study
Počítačová bezpečnostStudy program
InformatikaInstitutions assigning rank
katedra informační bezpečnostiRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Práca sa zameriava na aspekty a činitele, ktoré ovplyvňujú úspešnosť klasifikácie sieťovej premávky pomocou strojového učenia. Prvá časť práce popisuje základy počítačových sietí a ich monitorovania, existujúce metódy klasifikácie a princípy strojového učenia. Praktická časť práce skúma možnosti klasifikácie sieťovej premávky pri použití rôzne obsiahlych dátových sád a rôznych metód strojového učenia. Posledná časť práce sa venuje návrhu a vytvoreniu klasifikačného modulu pre systém NEMEA, ktorý je schopný klasifikovať rozšírené sieťové toky v reálnom čase. Výsledkom tejto práce je anotovaná dátová sada, obsahujúca rozšírené sieťové toky, sada experimentov skúmajúca možnosti klasifikácie sieťových tokov a klasifikačný modul pre systém NEMEA. This thesis focuses on the aspects and factors which affect the success of network traffic classification using machine learning. The first part of the thesis describes the basics of computer networks and their monitoring, existing classification methods and machine learning principles. The practical part of the thesis explores the possibilities of classifying network traffic using datasets of various features and different machine learning methods. The final part of the thesis deals with the design and development of a classification module for the NEMEA system, which is able to classify extended network flows in real time. The outcome of this thesis includes an annotated dataset containing extended network flows, a set of experiments exploring the possibilities of classifying network flows, and a classification module for the NEMEA system.