Parametrizovaná složitost problému Network Microaggregation
The Parameterized Complexity of Network Microaggregation
Typ dokumentu
diplomová prácemaster thesis
Autor
Jan Pokorný
Vedoucí práce
Knop Dušan
Oponent práce
Suchý Ondřej
Studijní obor
Teoretická informatikaStudijní program
InformatikaInstituce přidělující hodnost
katedra teoretické informatikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Mikroagregace je technika sloužící k rozdělení dat do shluků dle zadaných velikostních a vzdálenostní požadavků. V této práci se zabýváme případem, kdy data tvoří sít a dvěma variantami, zda shluky jsou souvislé nebo nejsou. Problém zkoumáme z hlediska kombinací parametrů danými problémem (maximální velikost shluků, maximální vzdálenost) a strukturálních parametrů (velikost vrcholového pokrytí, stromové šířky, stromové hloubky). Představujeme několik algoritmů, které ukazují, že problém lze efektivně řešit pomocí parametrizované složitosti. Jmenovitě představujeme pro souvislou verzi problému dynamické programování na stromovém rozkladu. Dále při parametrizaci pomocí velikosti vrcholového pokrytí a maximální vzdálenosti do centra ukazujeme FPT algoritmus na bázi celočíselného programování pro obě verze problému. Na druhé straně ukazujeme že problém je W[1] těžký při parametrizaci stromovou hloubkou a maximální vzdáleností v rámci souvislých shluků. Pokud jsou povoleny nesouvislé shluky, je problém W[1] těžký při parametrizaci velikostí vrcholového pokrytí. Nakonec ukazujeme, že problém Equitable Connected Partition je W[1] těžký vzhledem k parametru stromové hloubky. Microaggregation is a classical statistical disclosure control technique that requires the input data to be partitioned into clusters while adhering to specified size and distance constraints. We explore the problem when the data points are embedded into a network that specifies the distances. Additionally, we consider the case when the clusters are connected. We use a combination of input parameters (maximum cluster size, maximum distance) and structural parameters (vertex cover, treewidth, treedepth) to achieve or rule out tractability in various settings. Namely, we propose a dynamic programming algorithm for the connected version. Further, we show FPT algorithms parameterized by vertex cover and maximum distance based on integer linear programming for both versions of the problem. On the other hand, we show that the connected version is W[1]-hard with respect to treewidth and maximum distance. For disconnected clusters, the problem is also W[1]-hard when parameterized by the vertex cover number. Lastly, we establish W[1]-hardness of the problem Equitable Connected Partition when parameterized by treedepth.
Kolekce
- Diplomové práce - 18101 [216]