Nástroj pro statistické zkoumání velkých toků dat
Tool for big data statistical analysis
dc.contributor.advisor | Virius Miroslav | |
dc.contributor.author | Vecherskaya Aleksandra | |
dc.date.accessioned | 2016-10-17T08:32:44Z | |
dc.date.available | 2016-10-17T08:32:44Z | |
dc.date.issued | 2016-08-07 | |
dc.identifier | KOS-587864822705 | |
dc.identifier.uri | http://hdl.handle.net/10467/66048 | |
dc.description.abstract | Tato bakalářská práce představuje nástroj pro částečně řízenou analýzu DNS dat ze síťového provozu. Navrhovaná metoda zkoumá data na úrovni jednotlivých uživatelů a skládá se ze dvou částí: přípravy dat a modelování dat. Pro přípravu dat se zavádí nový způsob měření aktivity uživatelů, to jest normalizovaná entropie. Chování uživatelů v síti je reprezentováno časovou řadou hodnot entropie. Zmíněné časové řady jsou rozdělené do clusterů s využitím DTW jako měřítka podobnosti za účelem získání labelů pro řízené učení neuronové sítě. Modelovací část obsahuje obousměrnou LSTM neuronovou síť, která je trénovaná na behaviorálních řadách. Trénovaná neuronová síť je schopná rozpoznávat vzorce aktivity uživatelů v provozu v sítě ve skutečném čase. | cze |
dc.description.abstract | This thesis presents a tool for semi-supervised statistical analysis of the DNS network traffic data. The proposed method examines the traffic on the host level and consists of the data preparation part and the modelling part. For the data preparation we introduce a new way of measuring the host activity, i.e. normalised entropy. Host behaviour in the network is represented as temporal sequence of entropy values. The temporal sequences of DNS packets are clustered with the DTW as a similarity measure in order to obtain class labels for a supervised training of the neural network. The modelling part consists of the bidirectional LSTM neural network which is trained on behavioural sequences. After the training, the neural network is able to recognise patterns of the host activity in real-time mode. | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | cze |
dc.subject | BLSTM, DNS, klasifikace síťových dat, neuronová síť | cze |
dc.subject | BLSTM, DNS, network traffic classification, neural network | eng |
dc.title | Nástroj pro statistické zkoumání velkých toků dat | cze |
dc.title | Tool for big data statistical analysis | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.date.accepted | 2016-09-01 | |
dc.contributor.referee | Kukal Jaromír | |
theses.degree.discipline | Aplikovaná informatika | cze |
theses.degree.grantor | katedra matematiky | cze |
theses.degree.programme | Aplikace přírodních věd | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 14101 [278]