Show simple item record

Secure Data Deduplication in Cloud Storage Services

dc.contributor.advisorKencl Lukáš
dc.contributor.authorStaněk Jan
dc.date.accessioned2019-02-04T14:19:18Z
dc.date.available2019-02-04T14:19:18Z
dc.date.issued2019-01-10
dc.identifierKOS-322460087905
dc.identifier.urihttp://hdl.handle.net/10467/79342
dc.description.abstractCloudová úložiště se poslední dobou stala výhodnou alternativou k jiným typům úložišť, jejich provozovatelé se však potýkají s problémem jak skloubit optimalizaci a ochranu uložených dat. Pro zajištění utajenosti svých dat by klienti úložiště preferovali šifrovat data ještě na svém zařízení, nicméně takové šifrování efektivně znemožňuje provozovateli úložiště využít klasické techniky pro optimalizaci uložení dat, jako je například deduplikace. Na druhou stranu, optimalizační techniky určené k úspornějšímu uložení dat často využívají právě shodnost a podobnost dat, čímž, již z definice, porušují jejich utajení.Deduplikace dat je optimalizační technika, která nabízí velmi výhodný způsob jak šetřit úložnou kapacitu v cloudových úložištích využívaných mnoha klienty, nicméně její nasazení vyvolává mnoho otázek z hlediska bezpečnosti a ochrany dat. Soustředili jsme se na tyto otázky a analyzovali jsme možnosti jak skloubit šifrování a deduplikaci, čehož výsledkem je návrh nového řešení umožňujícího bezpečnou deduplikaci dat založenou na principu popularity dat. Náš návrh se opírá o předpoklad založený na reálném pozorování, že "tajemství sdílené příliš mnohokrát přestává býti tajemstvím", tedy, že pokud mnoho uživatelů ukládá shodná data, tato data pravděpodobně nevyžadují takovou ochranu, jako data uložena pouze několika málo uživateli. S využitím tohoto dělení dat, navržené řešení umožňuje chránit "nepopulární data" bezpečnějším způsobem, který znemožňuje deduplikaci a chránit "populární data" o něco méně bezpečným způsobem, který však deduplikaci umožňuje. Navržený mechanismus navíc podporuje automatický přechod mezi nepopulárními a populárními daty bez potřeby uživatelova zapojení do tohoto procesu a je úsporný z hlediska požadovaného výpočetního výkonu.Přestože naše řešení poskytuje rozumnou volbu pro některé skupiny dat, existují i skupiny dat, pro které se nehodí. To samé lze obecně říci o jakémkoliv v současnosti známém návrhu bezpečné deduplikace - typicky pro každou výhodu existuje i nějaká, k ní vztažená, nevýhoda. Abychom demonstrovali efektivitu našeho řešení, udělali jsme poměrně rozsáhlé porovnání jeho výkonnosti s výkonností dalších state-of-the-art řešení pro bezpečnou deduplikaci. Analyzovali jsme rozdílné přístupy k implementaci bezpečné deduplikace a jejich vlastnosti a popsali jsme jejich využitelnost v prostředích s různorodými požadavky.cze
dc.description.abstractCloud storage services became a viable alternative to other data storage options, however, their operators are facing an issue of optimization versus privacy. To ensure data confidentiality, clients would like to use end-to-end data encryption, however, proper encryption renders all of the classic storage optimization techniques, such as data deduplication, useless. On the other hand, these optimization techniques typically save space by exploitation of similarities and/or equalities in the data, which, by definition, breaks data confidentiality. Data deduplication is an optimization technique that offers very good space-saving possibility for multi-user cloud storage services, though its deployment raises multiple security and privacy concerns. To address these concerns, we analyze the (in)compatibility of deduplication and encryption and propose a novel \emph{secure deduplication solution} based on the concept of ``data popularity''. Our proposal rests on the real-life assumption that ``a secret shared too many times ceases to be a secret'' \textit{i.e.} that identical data outsourced to the cloud by many users do not require as strong protection as unpopular data that are outsourced by few users only. By introducing this distinction, our solution allows to protect unpopular data in a stronger, deduplication preventing, way, while providing weaker protection, allowing deduplication, to popular data. Moreover, the proposed mechanism supports transition between the popular and unpopular states to happen automatically, requiring only low computational overhead and no direct user interaction. While our solution is reasonably cost effective for some datasets, it is not very efficient for others. The same holds true for other secure deduplication proposals -- there is often an advantage accompanied by a disadvantage. To demonstrate efficiency of our solution we include an extensive performance evaluation as well as comparison of our scheme to other state-of-the-art secure-deduplication solutions. We analyze the different approaches and their features and comment on their applicability for deployments with varying requirements.eng
dc.language.isoENG
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectbezpečnost,ochrana dat,deduplikace,konvergentní šifrování,cloudové úložiště,popularita,kooperativní kryptosystémy,vícenásobné šifrovánícze
dc.subjectsecurity,data protection,deduplication,convergent encryption,cloud storage,popularity,threshold cryptosystem,multiple encryptioneng
dc.titleBezpečná deduplikace dat v cloudových úložištíchcze
dc.titleSecure Data Deduplication in Cloud Storage Serviceseng
dc.typedisertační prácecze
dc.typedoctoral thesiseng
dc.date.accepted
dc.contributor.refereeMatyáš Václav
theses.degree.disciplineTelekomunikační technikacze
theses.degree.grantorkatedra telekomunikační technikycze
theses.degree.programmeElektrotechnika a informatikacze


Files in this item


This item appears in the following Collection(s)

Show simple item record