Výběr reprezentativních vzorků z datových sad pro detekci malwaru
Selection of Representative Samples from Datasets for Malware Detection
dc.contributor.advisor | Jureček Martin | |
dc.contributor.author | Lukáš Děd | |
dc.date.accessioned | 2024-06-18T14:24:02Z | |
dc.date.available | 2024-06-18T14:24:02Z | |
dc.date.issued | 2024-06-07 | |
dc.identifier | KOS-1240469444005 | |
dc.identifier.uri | http://hdl.handle.net/10467/115292 | |
dc.description.abstract | Tato závěrečná se zabývá výběrem reprezentativních instancí trénovací množiny pro detekci malware. Experimenty byly provedeny na dvou veřejně dostupných datasetech, obsahujících metadata Windows PE souborů. Jedná se o datasety EMBER a SOREL-20M. V teoretické části jsou popsány metody předzpracování dat, instance selection algoritmy a klasifikační algoritmy, použité v praktické části této thesis, a také struktura PE souboru. Praktická část popisuje průběh předzpracování datasetů a hlavní experimenty související s porovnáním state-of-the-art instance selection algoritmů. V rámci závěrečné práce byly navrženy a implementovány modifikace paralelního instance selection algoritmu PIF, které byly rovněž experimentálně vyhodnoceny a porovnány s výsledky state-of-the-art instance selection algoritmů. | cze |
dc.description.abstract | This thesis focuses on the selection of representative instances for the training set in malware detection. Experiments were conducted on two publicly available datasets containing metadata of Windows PE files, namely the EMBER and SOREL-20M datasets. The theoretical part describes data preprocessing methods, instance selection algorithms, and classification algorithms used in the practical part of this thesis. It also includes a description of the structure of PE files. The practical part outlines the process of preprocessing datasets and main experiments related to the comparison of state-of-the-art instance selection algorithms. As part of the thesis, modifications to the parallel instance selection algorithm PIF were proposed and implemented, and these were also experimentally evaluated and compared with the results of state-of-the-art instance selection algorithms. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | výběr instancí | cze |
dc.subject | PIF | cze |
dc.subject | DROP3 | cze |
dc.subject | MSS | cze |
dc.subject | CNN | cze |
dc.subject | ICF | cze |
dc.subject | AllKNN | cze |
dc.subject | RENN | cze |
dc.subject | ENN | cze |
dc.subject | KNN | cze |
dc.subject | strojové učení | cze |
dc.subject | umělá inteligence | cze |
dc.subject | klasifikace | cze |
dc.subject | malware | cze |
dc.subject | PE soubory | cze |
dc.subject | Windows | cze |
dc.subject | instance selection | eng |
dc.subject | PIF | eng |
dc.subject | DROP3 | eng |
dc.subject | MSS | eng |
dc.subject | CNN | eng |
dc.subject | ICF | eng |
dc.subject | AllKNN | eng |
dc.subject | RENN | eng |
dc.subject | ENN | eng |
dc.subject | KNN | eng |
dc.subject | machine learning | eng |
dc.subject | artificial intelligence | eng |
dc.subject | classification | eng |
dc.subject | malware | eng |
dc.subject | PE files | eng |
dc.subject | Windows | eng |
dc.title | Výběr reprezentativních vzorků z datových sad pro detekci malwaru | cze |
dc.title | Selection of Representative Samples from Datasets for Malware Detection | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Kozák Matouš | |
theses.degree.discipline | Počítačová bezpečnost | cze |
theses.degree.grantor | katedra informační bezpečnosti | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18106 [113]