Interpretovatelnost výsledků detekce malware založených na strojovém učení pomocí sady pravidel

Jan Dolejš

Interpretability of machine learning-based results of malware detection using a set of rules

dc.contributor.advisor	Jureček Martin
dc.contributor.author	Jan Dolejš
dc.date.accessioned	2021-06-10T22:52:01Z
dc.date.available	2021-06-10T22:52:01Z
dc.date.issued	2021-06-10
dc.identifier	KOS-882931065605
dc.identifier.uri	http://hdl.handle.net/10467/94894
dc.description.abstract	Metody strojového učení se prokázaly jako užitečný nástroj v řadě aplikací. Antivirové společnosti našly jejich využití i pro rychlou a spolehlivou detekci malwaru, poskytující jejich uživatelům bezpečnější prostředí před každodenními hrozbami. Metody strojového učení, jako jsou například hluboké neuronové sítě, jsou však často považovány za black boxy, jelikož důvody jejich rozhodnutí mohou být často nejasné. Jejich intepretovatelnost je důležitá a pomáhá pochopit potenciálně chybná rozhodnutí. Tato práce se zabývá algoritmy pro tvorbu pravidel a zkoumá jejich potenciál v rámci interpretace výsledků metod strojového učení. V práci bylo využito dvou veřejně dostupných datasetů, obsahujících atributy PE souborů, a na míru navržených implementací algoritmů pro tvorbu pravidel. Výsledky ukázaly, že algoritmus RIPPER je v tomto úkolu převážně úspěšný; vysokou přesnost vykazoval i při zachování kompaktních sad pravidel, což dělá z algoritmů pro tvorbu pravidel užitečnou alternativu metody založené na signaturách.	cze
dc.description.abstract	Machine learning methods have been quite successful in a variety of applications. Antivirus companies use them for quick and reliable malware detection, providing their users with a safer environment from ceaseless daily threats. However, machine learning methods such as deep neural networks are often considered black boxes as the reasoning behind their decisions may often be unclear. Their interpretability is important and helps understand potential errorful decisions. This thesis studies rule-learning algorithms and explores their potential to interpret the outcomes of machine learning algorithms. Two publicly available datasets with Portable Executable file attributes and tailor-made implementations of rule-learning algorithms were used throughout the work. Results showed that algorithm RIPPER is mostly successful at this task; it achieved high accuracies while maintaining compact sets of rules, making rule-learning algorithms a useful alternative to signature-based methods.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	detekce malwaru	cze
dc.subject	klasifikátory založené na pravidlech	cze
dc.subject	interpretace strojového učení	cze
dc.subject	PE soubory	cze
dc.subject	malware detection	eng
dc.subject	rule-based classifiers	eng
dc.subject	interpreting machine learning	eng
dc.subject	PE files	eng
dc.title	Interpretovatelnost výsledků detekce malware založených na strojovém učení pomocí sady pravidel	cze
dc.title	Interpretability of machine learning-based results of malware detection using a set of rules	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.contributor.referee	Lórencz Róbert
theses.degree.discipline	Bezpečnost a informační technologie	cze
theses.degree.grantor	katedra počítačových systémů	cze
theses.degree.programme	Informatika 2009	cze

Soubory tohoto záznamu

Název:: F8-BP-2021-Dolejs-Jan-BT_Dolej ...
Velikost:: 709.1Kb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F8-BP-2021-Dolejs-Jan-priloha- ...
Velikost:: 10.54Mb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F8-BP-2021-posudek-Lorencz_Rob ...
Velikost:: 43.01Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F8-BP-2021-posudek-Jurecek_Mar ...
Velikost:: 45.00Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 18104 [348]

Zobrazit minimální záznam