Zobrazit minimální záznam

Task aware relation-types selection for machine learning algorithms on graph



dc.contributor.advisorProcházka Pavel
dc.contributor.authorMichal Mareš
dc.date.accessioned2023-06-15T22:56:25Z
dc.date.available2023-06-15T22:56:25Z
dc.date.issued2023-06-15
dc.identifierKOS-1243608767005
dc.identifier.urihttp://hdl.handle.net/10467/109520
dc.description.abstractV této závěrečné práci zkoumám souvislost mezi strukturou grafu a výkonem grafových algorithmů pro úlohu vyhledávání uzlů se specifickou vlastností. Hlavním cílem je identifikovat strukturální vlastnosti, které přispívají k lepším výsledkům a mohou být použity pro výběr vhodných typů relací při stavbě grafu. Výzkum probíhá na soukromém datasetu síťové komunikace poskytnutém společností Cisco a na volně dostupných grafových datasetech. Představuji nový přístup k vyhodnocování důležitých strukturálních vlastnostní na grafech. Metoda využívá "meta-model" pro regresi využívající strukturální vlastnosti grafu jako příznaky a výsledek výkonnostní metriky algorithmu jako predikovanou hodnotu. Strukturální vlastnosti jsou navrženy podle odborné literatury a zároveň zavádím novou definici matice záměn orienovanou na hrany při úkolu vyhledávání uzlů cílové třídy. Experimentální vyhodnocení naznačuje, že důležité grafové vlastnosti se liší napříč datsety, algoritmy a metrikami výkonu. Zajímavým uplatněním navrhovaného přístupu je vyhledávání hyperparametrů, kde dosahujeme povzbudivých výsledků které by mohly mít za následek snížení náročnosti optimalizace hyperparametrů pro algoritmy strojového učení na grafech. Tato aplikace ale vyžaduje další výzkum, aby mohly být stanoveny hranice aplikace a její teoretický základ. Navzdory svým limitacím tato práce přispívá oblasti strojového učení na grafech zavedením nové metody vysvětlování a určování důležitosti strukturálních grafových vlastností. V budoucnu bych se rád zaměřil na normalizaci grafových vlastností, zlepšení analýzy výsledků důležitosti vlastnostní a důkladnější prozkoumání aplikace této metody pro hledání hyperparametrů.cze
dc.description.abstractThis thesis explores the connection between graph structure and the performance of graph algorithms in retrieval task. The main goal is to identify structural features that contribute to better performance and can be used to select relevant relation types. The research is conducted on private datset of network flows provided by Cisco and public graph datasets. A novel approach is introduced for evaluating the importance of structural features on graphs. This method uses a regression meta-model on datapoints consisting of graph features and task performance obtained using the studied graph machine learning algorithm. The thesis studies multiple graph features, and proposes a novel definition of an edge-based confusion matrix for retrieval tasks on a graph. Experimental results indicate that important graph features vary across datasets, algorithms and performance metrics. An additional application of the proposed approach is shown in accelerating hyperparameter search, which shows promising results but requires further research to provide theoretical boundaries. Despite its limitations, this work contributes to the field of graph machine learning by providing a more comprehensive and explainable approach for evaluating the importance of graph features. Future work should focus on normalizing graph features, refining feature importance analysis, and conducting a thorough investigation of the hyperparameter search application.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectteorie grafůcze
dc.subjectgrafové algoritmycze
dc.subjectgrafové neuronové sítěcze
dc.subjectklasifikace uzlů grafucze
dc.subjectkyberbezpečnostcze
dc.subjectzískávání informacícze
dc.subjectdetekce malwarucze
dc.subjectsíťová komunikacecze
dc.subjectstrojové učenícze
dc.subjectgraph theoryeng
dc.subjectgraph algorithmseng
dc.subjectgraph neural networkseng
dc.subjectnode classificationeng
dc.subjectmessage passingeng
dc.subjectindicators of compromiseeng
dc.subjectcybersecurityeng
dc.subjectinformation retrievaleng
dc.subjectmalware detectioneng
dc.subjectnetwork trafficeng
dc.subjectmachine learningeng
dc.titleVýběr vhodných typů relací pro algoritmy strojového učení na grafechcze
dc.titleTask aware relation-types selection for machine learning algorithms on grapheng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeLukáš Ondřej
theses.degree.disciplineUmělá inteligencecze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam