Interpretovatelnost výsledků detekce malware založených na strojovém učení pomocí sady pravidel
Interpretability of machine learning-based results of malware detection using a set of rules
dc.contributor.advisor | Jureček Martin | |
dc.contributor.author | Jan Dolejš | |
dc.date.accessioned | 2021-06-10T22:52:01Z | |
dc.date.available | 2021-06-10T22:52:01Z | |
dc.date.issued | 2021-06-10 | |
dc.identifier | KOS-882931065605 | |
dc.identifier.uri | http://hdl.handle.net/10467/94894 | |
dc.description.abstract | Metody strojového učení se prokázaly jako užitečný nástroj v řadě aplikací. Antivirové společnosti našly jejich využití i pro rychlou a spolehlivou detekci malwaru, poskytující jejich uživatelům bezpečnější prostředí před každodenními hrozbami. Metody strojového učení, jako jsou například hluboké neuronové sítě, jsou však často považovány za black boxy, jelikož důvody jejich rozhodnutí mohou být často nejasné. Jejich intepretovatelnost je důležitá a pomáhá pochopit potenciálně chybná rozhodnutí. Tato práce se zabývá algoritmy pro tvorbu pravidel a zkoumá jejich potenciál v rámci interpretace výsledků metod strojového učení. V práci bylo využito dvou veřejně dostupných datasetů, obsahujících atributy PE souborů, a na míru navržených implementací algoritmů pro tvorbu pravidel. Výsledky ukázaly, že algoritmus RIPPER je v tomto úkolu převážně úspěšný; vysokou přesnost vykazoval i při zachování kompaktních sad pravidel, což dělá z algoritmů pro tvorbu pravidel užitečnou alternativu metody založené na signaturách. | cze |
dc.description.abstract | Machine learning methods have been quite successful in a variety of applications. Antivirus companies use them for quick and reliable malware detection, providing their users with a safer environment from ceaseless daily threats. However, machine learning methods such as deep neural networks are often considered black boxes as the reasoning behind their decisions may often be unclear. Their interpretability is important and helps understand potential errorful decisions. This thesis studies rule-learning algorithms and explores their potential to interpret the outcomes of machine learning algorithms. Two publicly available datasets with Portable Executable file attributes and tailor-made implementations of rule-learning algorithms were used throughout the work. Results showed that algorithm RIPPER is mostly successful at this task; it achieved high accuracies while maintaining compact sets of rules, making rule-learning algorithms a useful alternative to signature-based methods. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | detekce malwaru | cze |
dc.subject | klasifikátory založené na pravidlech | cze |
dc.subject | interpretace strojového učení | cze |
dc.subject | PE soubory | cze |
dc.subject | malware detection | eng |
dc.subject | rule-based classifiers | eng |
dc.subject | interpreting machine learning | eng |
dc.subject | PE files | eng |
dc.title | Interpretovatelnost výsledků detekce malware založených na strojovém učení pomocí sady pravidel | cze |
dc.title | Interpretability of machine learning-based results of malware detection using a set of rules | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Lórencz Róbert | |
theses.degree.discipline | Bezpečnost a informační technologie | cze |
theses.degree.grantor | katedra počítačových systémů | cze |
theses.degree.programme | Informatika 2009 | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18104 [348]