Paměťově efektivní reprezentace shluků v nemetrických prostorech.
Memory efficient cluster representations in non-metric spaces.
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Jaroslav Hlaváč
Vedoucí práce
Kopp Martin
Oponent práce
Kohout Jan
Studijní obor
Bezpečnost a informační technologieStudijní program
InformatikaInstituce přidělující hodnost
katedra počítačových systémůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Internet je dnes nejpouživanějšim komunikačnim médiem a proto je bezpečnost počitačových siti aktuálnim tématem. Monitorováni opakujicich se vzorů v chováni jednotlivých siti je jeden z možných přistupů k jejich zabezpečováni. Přesnost a rychlost detekce anomálii je závislá na kvalitě modelu vytvořeného pro danou sit'. Na základě chováni jednotlivých prvků lze sit' rozdělit na menši části. Tim se předejde přiliš robustnimu modelu zanesenému šumem způsobeným různorodosti prvků v siti. Jeden z možných přistupů k vytvořeni těchto části je komunitni shlukováni. Tyto shluky mohou mit až tisice reprezen-tantů, pokud se jedná o velkou sit'. V této práci je prezentován algoritmus pro vytvářeni shlukových proto-typů v Cognitive Targeted Anomaly Detection Framework. Momentálně jsou shluky v tomto frameworku reprezentovány náhodnou podmnožinou prvků z celého shluku. Pro shlukováni se použivá párová podobnost mezi jednotlivými prvky. Proto je potřeba využit medodu pro výběr reprezentantů, která je použitelná i v topologických prostorech. Modifikovaný algoritmus d-Medoids je představen jako nová metoda pro vytvářeni shlukových prototypů. Algo-ritmus d-Medoids Modified pro každý shluk zajišt'uje výběr malého množstvi reprezentantů s maximálnim množstvim zachované informace pro použiti v klasifikačnich problémech a je rychlejši než nemodifikovaná verze algoritmu. The Internet is a dominant medium for communication, therefore securing computer network is a crucial task. One approach for securing networks is monitoring their behavior patterns. Precise and fast network behavior anomaly detection highly depends on the models created for the monitored network. To create a model that is not clogged by noise from the whole network, hosts can be separated into smaller groups by community-based clustering. On big networks of tens of thousands devices, these clusters can contain several thousands of hosts. This thesis presents an algorithm for finding cluster prototypes for clusters in Cognitive Targeted Anomaly Detection Framework. In the framework, a pair-wise similarity measure is used for clustering. Clusters are then represented by a number of randomly selected samples. Therefore, representative selection methods for topological spaces have to be used. A modification of d-Medoids algorithm is proposed with the ability to select a low number of representatives while maintaining the best possible coverage of the cluster. The introduced algorithm is also faster then the unmodified version of d-Medoids.
Kolekce
- Bakalářské práce - 18104 [348]