Show simple item record

Estimating webpage content in secure communication



dc.contributor.advisorKlouda Karel
dc.contributor.authorMarek Mařík
dc.date.accessioned2021-01-29T23:51:38Z
dc.date.available2021-01-29T23:51:38Z
dc.date.issued2021-01-29
dc.identifierKOS-862365857605
dc.identifier.urihttp://hdl.handle.net/10467/92924
dc.description.abstractTato práce se zabývá tím, zda je možné ze síťového provozu určit, jaké webové stránky byly uživatelem navštíveny i přes to, že komunikace probíhá šifrovaným způsobem. Dále pak tím, zda je možné alespoň přibližně určit obsah webové stránky z šifrovaného síťového provozu. To vše na základě charakteristik síťových toků, tedy aniž by byl provoz dešifrován. V rámci této práce byl navrhnut a implementován generátor datových sad, který umožňuje vytvářet datové sady, které obsahují zachycené síťové toky pro návštěvy jednotlivých webových stránek. S pomocí tohoto generátoru byly vytvořeny dvě datové sady. Byla navržena rozmanitá sada příznaků. Na základě vektorů příznaků byly provedeny experimenty s použitím různých modelů pro identifikaci webových stránek a odhad jejich obsahu. Dále byly vytvořeny modely, jejichž úkolem je detekce neznámých webových stránek. Z provedených experimentů vyplývá, že na základě šifrovaného provozu lze poměrně přesně identifikovat webové stránky a dokonce i odhadnout některé atributy jejich obsahu.cze
dc.description.abstractThis master thesis deals with whether it is possible to determine from network traffic which websites were visited by the user despite the fact that the communication takes place in an encrypted way. Furthermore, whether it is possible to at least approximately determine the content of the web page from encrypted network traffic. All this based on the characteristics of network flows, i.e. without the traffic being decrypted. As part of this work, a data set generator was designed and implemented, which allows to create data sets that contain captured network flows for visits to individual websites. Two datasets were created using this generator. A diverse set of features has been designed. Based on the features vectors, experiments were performed using multiple different models to identify websites and estimate their content. Furthermore, novelty detection models were created to detect unknown web pages. Experiments show that based on encrypted traffic, websites can be relatively accurately identified and some attributes of their content can be estimated as well.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectidentifikace provozucze
dc.subjectidentifikace webových stránekcze
dc.subjectwebový provozcze
dc.subjectšifrovaný provozcze
dc.subjectHTTPScze
dc.subjectzáznam šifrovaného provozucze
dc.subjectklasifikacecze
dc.subjectregresecze
dc.subjectstrojové učenícze
dc.subjecttraffic identificationeng
dc.subjectwebsite identificationeng
dc.subjectweb trafficeng
dc.subjectencrypted trafficeng
dc.subjectHTTPSeng
dc.subjectencrypted traffic recordeng
dc.subjectclassificationeng
dc.subjectregressioneng
dc.subjectmachine learningeng
dc.titleIdentifikace webového obsahu v šifrovaném provozucze
dc.titleEstimating webpage content in secure communicationeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeHynek Karel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatikacze


Files in this item




This item appears in the following Collection(s)

Show simple item record