Otevřené zdroje dat v síti Internet a možnosti jejich vytěžování
Open Data Sources in the Internet and Possibilities of Their Extraction
Typ dokumentu
diplomová prácemaster thesis
Autor
Jan Tisančín
Vedoucí práce
Navrátil Václav
Oponent práce
Čupr Břetislav
Studijní obor
Civilní nouzové plánováníStudijní program
Ochrana obyvatelstvaInstituce přidělující hodnost
katedra zdravotnických oborů a ochrany obyvatelstvaPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Diplomová práce zkoumá možnosti vytěžování otevřených zdrojů z prostředí sítě Internet ve vztahu k uživatelům. V teoretické části tyto možnosti komparuje s právním rámcem GDPR, který zajišťuje ochranu osobních údajů uživatelů. Popisuje zdroje výskytu údajů o uživatelích a možná rizika, která z uveřejňování dat pramení. Poslední kapitola teoretické části představuje metody pro vytěžování dat. V praktické části práce je provedena případová studie na vzorku 100 uživatelů, k nimž s využitím popsaných metod OSINT proběhl sběr dat. Výsledky studie byly dále vyhodnoceny dle rizik, která uživatelům hrozí a analyzovány formou MCDA. Analýza na problém nahlíží z pohledu možného útočníka a demonstruje jeho možnost realizovat vybrané typy hrozeb. Kazuistiky jsou orientovány na weby, které využívají uživatelé z České republiky zejména pro inzerci. Výzkumem zároveň došlo k vyvrácení obou stanovených hypotéz. Byla zjištěna souvislost mezi počtem úniků uživatelských dat a obdobím, kdy na prostředí mohlo mít vliv nařízení GDPR. Bylo také zjištěno, že uživatelé aktivně obchází prvky, které je mají chránit před možným sběrem dat, což může mít za následek archivaci jejich údajů. Aplikace práva být zapomenut, které nařízení GDPR zavedlo, je pak značně ztížená až nemožná. Zjištěné nedostatky hodnotí závěrečná diskuzní část, ve které jsou zároveň navrženy způsoby jejich řešení. Diskuze zároveň provádí rozbor situací, se kterými jsem se v rámci výzkumu setkal a demonstruje možná rizika. The diploma thesis examines the possibilities of extracting data about users from open sources on the Internet. In the theoretical part, the possibilities are compared with the legal framework (GDPR) that ensures the protection of users' personal data. It describes the sources of user data and the potential risks of publishing data. The last chapter of the theoretical part presents methods for data mining. In the practical part of the work, a case study was performed on 100 users. For these, data collection was performed using OSINT methods. The results of the study were evaluated according to the risks they pose to users and further analyzed using MCDA. The analysis uses the perspective of a potential attacker, thus demonstrating the possibility of carrying out some of the attacks which are described here in the theoretical part. The case studies are focused on websites that are used by users from the Czech Republic, especially for auctioning. The performed research also refuted both hypotheses. A link was found between the number of user data leaks and the period when the environment could have been affected by the GDPR Regulation. It has also been observed that users actively bypass the elements designed to protect them from possible data collection. Such behaviour can result in the archiving of their data and the application of the right to be forgotten, which the GDPR regulation introduced, is then considerably more difficult or even impossible. The identified shortcomings are evaluated in the final discussion part, in which ways of their solution are proposed. The discussion also analyzes the situations I encountered in the research and demonstrates the possible risks.
Kolekce
- Diplomové práce - 17111 [284]