Simulation of malware detection model
Simulace detekčního modelu škodlivého kódu
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
Množství škodlivých programů neustále stoupá a útočníci stále přicházejí s novými technikami, kterými se snaží oklamat používané detekční metody. Tato práce se zabývá automatickou detekcí škodlivého kódu pomocí algoritmů strojového učení. Hlavním rozdílem oproti podobným pracím z tohoto oboru je provedený pokus, který se zaměřuje na napodobení naučeného klasifikátoru. K napodobování klasifikátoru byly vybrány čtyři algoritmy strojového učení. Neuronové sítě, K-nejbližších sousedů, Rozhodovací stromy a Naivní Bayesův klasifikátor. Napodobovaný model se podařilo napodobit nejlépe pomocí varianty neuronových sítí. Výsledná vícevrstvá perceptronová síť dosáhla přesnosti 98,68 %.
The number of harmful programs is still rising, and attackers invent new techniques to avoid detection every day. This thesis focuses on automatic malware classification by using machine learning algorithms. The main difference from other work in this field of study is experiment that mimics behavior of a detection model. Four machine learning algorithms were used for this experiment. Neural networks, K-nearest neighbors, Decision trees and Naive Bayes classifier. The best result was achieved by using a variant of neural network. Multilayer perceptron network simulated the model with accuracy of 98,68 %.
The number of harmful programs is still rising, and attackers invent new techniques to avoid detection every day. This thesis focuses on automatic malware classification by using machine learning algorithms. The main difference from other work in this field of study is experiment that mimics behavior of a detection model. Four machine learning algorithms were used for this experiment. Neural networks, K-nearest neighbors, Decision trees and Naive Bayes classifier. The best result was achieved by using a variant of neural network. Multilayer perceptron network simulated the model with accuracy of 98,68 %.