ČVUT DSpace
  • Search DSpace
  • Čeština
  • Login
  • Čeština
  • Čeština
View Item 
  •   ČVUT DSpace
  • Czech Technical University in Prague
  • Faculty of Information Technology
  • Doctoral Theses - 18000
  • View Item
  • Czech Technical University in Prague
  • Faculty of Information Technology
  • Doctoral Theses - 18000
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Hierarchické Semi-Sparse Kostky - škálovatelné řešení pro kombinování dimenzionálně multi-modálních velkých dat

Hierarchical Semi-Sparse Cubes - scalable solution for combining dimensionally multi-modal big data

Type of document
disertační práce
doctoral thesis
Author
Jiří Nádvorník
Supervisor
Tvrdík Pavel
Opponent
Zeitouni Karine
Field of study
Informatika
Study program
Informatika
Institutions assigning rank
katedra počítačových systémů



Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item record
Abstract
Vzhledem k tomu, že Moorův zákon se vztahuje i na detektory, které data produkují, objem pozorovaných dat v astronomii se každý rok zhruba zdvojnásobuje. Důkazem je například nová Square Kilometer Array (SKA) astronomická přehlídka oblohy, která vyprodukuje zhruba 8.5 exabytů dat ve svých prvních 15 letech provozu, který začíná v roce 2027. Kapacita datových úložišť roste stejně rychle, stejně jako schopnost zpracovávat tyto data primárními analytickými nástroji. Kde přichází problém je schopnost kombinovat velká data z několika takovýchto detektorů. Vytěžit informace z těchto velkých dat je relativně snadné, ale odvozování nových znalostí na základě těchto informací je možné jen pokud se na ně díváme v kontextu. To vyžaduje kombinaci dat z několika zdrojů. V této dizertaci představujeme softwarové řešení „Hierarchical Semi-Sparse Cube“ (HiSS-Cube). Klade si za cíl masivně paralelní kombinaci a zpracování dimenzionálně multi-modálních velkých dat. Otestovali jsme škálovatelnost a efektivitu na astronomických velkých datech ze spektrometrických a fotometrických přehlídek Sloan Digital Sky Survey (SDSS). Ověřili jsme, že HiSS-Cube je omezen I/O propustností a I/O operacemi za sekundu paralelního file systému, na kterém software běží, tedy že škáluje lineárně s počtem I/O uzlů.
 
Since Moore`s law applies also to data detectors, the volume of data collected in astronomy doubles approximately every year. A prime example is the upcoming Square Kilometer Array (SKA) survey that will produce approximately~8.5 exabytes over the first 15 years of service, starting in the year 2027. Storage capacities for these data have grown as well, and primary analytical tools have also kept up. However, the tools for combining big data from several such detectors still lag behind. Finding interesting information in the big data is relatively easy, but inferring new knowledge based on this information is possible only when it is put into context. That requires to combine the information from multiple data sources. In this thesis, we present the Hierarchical Semi-Sparse Cube (HiSS-Cube) framework. It aims to provide highly parallel processing of combined dimensionally multi-modal big data. We tested the scalability and efficiency of HiSS-Cube on big astronomical spectroscopic and photometric data obtained from the Sloan Digital Sky Survey (SDSS). The performance of HiSS-Cube is bounded by the I/O bandwidth and I/O operations per second of the underlying parallel file system, and it scales linearly with the number of I/O nodes.
 
URI
http://hdl.handle.net/10467/117239
View/Open
POSUDEK (843.6Kb)
POSUDEK (606.4Kb)
POSUDEK (596.6Kb)
POSUDEK (238.0Kb)
PLNY_TEXT (25.33Mb)
Collections
  • Disertační práce - 18000 [53]

Related items

Showing items related by title, author, creator and subject.

  • Využití multi-instančního učení v bezpečnosti počítačových sítí 

    Author: Páterek Benjamín; Supervisor: Kohout Jan; Opponent: Komárek Tomáš
    (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2018-08-30)
    Multi-inštančné učenie je typom strojového učenia, v ktorom sú inštancie usporiadané do súborov. V tomto odvetví zohrávajú doležitú úlohu reprezentácie a funkcie pre výpočet vzdialenosti medzi súbormi. Táto práca skúma ich ...
  • Multi-agentní hledání cest s více cíli pomocí výrokové splnitelnosti 

    Author: Štěpán Tupý; Supervisor: Surynek Pavel; Opponent: Starý Jan
    (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-15)
    Tato práce se zabývá hledáním optimálního řešení problému multi-agentního hledání cest s více cíli (MG-MAPF), který je zobecněním multi-agentního hledání cest (MAPF). Úkolem v problému MG-MAPF je nalezení nekonfliktní cesty ...
  • Centralizované plánování autonomní dopravy 

    Author: Ondřej Pleticha; Supervisor: Surynek Pavel; Opponent: Klouda Karel
    (České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2020-06-12)
    Tato diplomová práce se zabývá problémem řízení autonomní dopravy ve městech. Je uvažována budoucnost, kde jsou všechna vozidla sdílená a dokáží přepravovat osoby či předměty sama bez řidiče. Zákazníci pouze vytváří požadavky ...

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Useful links

CTU in PragueCentral library of CTUAbout CTU Digital LibraryResourcesStudy and library skillsResearch support

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV