Decentralizované federativní učení pro síťovou bezpečnost

Pavel Janata

Decentralized Federated Learning for Network Security

Typ dokumentu

diplomová práce
master thesis

Autor

Pavel Janata

Vedoucí práce

García Sebastián

Oponent práce

Catania Carlos

Studijní obor

Datové vědy

Studijní program

Otevřená informatika

Instituce přidělující hodnost

katedra počítačů

Obhájeno

2023-02-08

Práva

A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html

Metadata

Zobrazit celý záznam

Abstrakt

Síťová bezpečnost je v dnešním propojeném světě stále důležitějším problémem, protože počet a složitost hrozeb neustále roste. Federativní učení (FL) je metoda strojového učení, která umožňuje distribuovaně trénovat model s využitím dat klientů a zároveň chránit jejich soukromí. V této práci představujeme FL řešení pro síťovou bezpečnost, konkrétně pro detekci aktivity malwaru v HTTPS provozu. Vyvinuli jsme metody s učitelem i bez učitele pro detekci malwaru v datech klientů. Naše metody vyhodnocujeme pomocí datové sady CTU-50-FEEL, která obsahuje realistický „neškodný“ provoz deseti uživatelů v rozpětí pěti dnů a také provoz šesti různých druhů malwaru. Naše experimentální výsledky ukazují, že náš přístup založený na federativním učení je schopen detekovat širší škálu hrozeb s vyšší přesností, než kdyby se klienti při vytváření svých modelů spoléhali pouze na svá vlastní data. Celkově naše práce prokazuje proveditelnost použití federativního učení pro detekci aktivity malwaru u klientů s non-IID síťovým provozem při zachování jejich soukromí.

Network security is an increasingly important concern in today's connected world as the number and complexity of threats continue to grow. Federated learning (FL) is a machine learning method to distributedly train an model using clients' data while protecting their privacy. In this thesis, we present an FL solution for network security, specifically for detecting malware activity in HTTPS traffic. We developed both supervised and unsupervised methods for detecting malware in the clients' data. We evaluate our methods using the CTU-50-FEEL dataset, which contains realistic benign traffic of ten users spanning five days, as well as traffic of six distinct malware. Our experimental results show that our federated learning approach is able to detect a wider range of threats with higher accuracy than if the clients relied only on their own data to create their models. Overall, our work demonstrates the feasibility of using Federated Learning for detecting malware activity in clients with non-IID network traffic while preserving their privacy.