Data pseudonymization using the HSM module
Pseudonymizace dat pomocí HSM modulu
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
V diplomové práci se zabýváme myšlenkou pseudonymizace dat většího rozsahu. Abychom byli schopni taková data efektivně zpracovávat, využijeme technologie z oblasti Big Data. Budeme předpokládat, že data, která chráníme, mají povahu osobních a citlivých údajů. Na ta se vztahují zvláštní legislativní požadavky dle nařízení EU. Je důležité taková data chránit před osobami, které ze své pracovní pozice nepotřebují s těmito daty pracovat. Vzhledem k důležitosti těchto dat volíme přístup pseudonimizace za využití HSM. V principu nám jde o návrh řešení, které bude jednoduše integrovatelné do reálného prostředí využívajícího Big Data technologie.
In this thesis, we explore the idea of pseudonymizing large-scale data. In order to be able to process such data efficiently, we will use technologies from the field of Big Data. We will assume that the data we protect is personal and sensitive in nature. These are subject to specific legislative requirements under EU regulations. It is important to protect such data from individuals who, by virtue of their job role, do not need to work with this data. Given the importance of this data, we choose a pseudonymisation approach using HSM. In principle, we want to design a solution that can be easily integrated into a real environment using Big Data technologies.
In this thesis, we explore the idea of pseudonymizing large-scale data. In order to be able to process such data efficiently, we will use technologies from the field of Big Data. We will assume that the data we protect is personal and sensitive in nature. These are subject to specific legislative requirements under EU regulations. It is important to protect such data from individuals who, by virtue of their job role, do not need to work with this data. Given the importance of this data, we choose a pseudonymisation approach using HSM. In principle, we want to design a solution that can be easily integrated into a real environment using Big Data technologies.