Anonymizace osobních údajů v dokumentech
Personal data anonymization in documents
Type of document
bakalářská prácebachelor thesis
Author
Radomír Ort
Supervisor
Mlejnek Jiří
Opponent
Rybola Zdeněk
Field of study
Webové a softwarové inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra softwarového inženýrstvíRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Winch je nástroj pro anonymizaci osobních údajů vyvíjený pražskou softwarovou společností GEM System a.s. Winch byl primárně navržen pro anonymizaci dat uložených v databázích, podpora pro anonymizaci dat v souborech mu scházela. Tato práce je součástí snahy o doplnění chybějící funkcionality. Práce se zabývá tabulkovými soubory (tj. soubory ve formátech XLS nebo ODS, které podporují nástroje z balíku MS Office nebo Open Office, nebo soubory ve formátu CSV) i nestrukturovanými soubory a předkládá několik návrhů pro jejich reprezentaci pomocí anonymizačního modelu. Výhody a nedostatky jednotlivých návrhů jsou podrobně diskutovány a nejvhodnější model je doporučen k implementaci. Na základě zvoleného modelu je připraven návrh architektury a provedena implementace rozšíření nástroje Winch o anonymizaci osobních údajů v souborech XLS a XLSX uložených na lokálních a síťových discích. Práce podává detailní návod, jak doplnit podporu pro další typy souborů a souborových systémů. Implementace je důkladně otestována. Winch is a data anonymization tool marketed by GEM System, a small software house based in Prague, Czech Republic. Designed to sanitize personal data in relational databases, the tool lacks support for handling confidential data in documents stored on a file system. This thesis is intended to be an early step of an initiative to close this gap. The thesis lays out multiple options for building a model representing the contents of structured files (such as XLS or ODS workbooks produced by MS Office or Open Office suites or CSV files) as well as non-structured documents and discusses their qualities in order to choose the most suitable model. An extension to Winch is then designed and developed, incorporating the selected model. The resulting implementation delivers data anonymization for XLS and XLSX files stored on local and network disk drives; the thesis gives instructions on how to extend support to other file types and repositories. The committed code is fully tested.
Collections
- Bakalářské práce - 18102 [1729]