Strojové učení v astroinformatice s použitím masivně paralelního zpracování dat
Machine Learning in Astroinformatics Using Massively Parallel Data Processing
dc.contributor.advisor | Škoda Petr | |
dc.contributor.author | Peterka Tomáš | |
dc.date.accessioned | 2016-02-25T14:52:42Z | |
dc.date.available | 2016-02-25T14:52:42Z | |
dc.identifier | KOS-541818247905 | |
dc.identifier.uri | http://hdl.handle.net/10467/62747 | |
dc.description.abstract | Moderní astronomie a ostatní oblasti přírodních věd se potýkají s exponenciál-ně rostoucím objemem dat. Tento fenomén vedl k průniku počítačových věd do oblasti těchto čistě přírodních věd. V případě současné astronomie hovoříme o takzvané astroinformatice. Tato práce je přehlídkou nejmodernějších paralelních algoritmů strojového učení a jejich použití na astronomických velkých datech. Sestrojili jsme klasifikátory založené na hlubokých neuronových sítích schopných běžet na grafi-ckých procesorech za použití Caffe frameworku. Vyvinuli jsme efektivní vstupní vrstvu pro Caffe modely, která je schopná pracovat s obecnými textovými soubory a má velmi intuitivní konfiguraci. Za použití klasifikátoru jsme natré-novali dva modely podle vzorových dat. Model pro spektra je dvouvrstvá konvoluční síť s přesností klasifikace přes 99\% a průměrnou propustností 1440 MB/s. Zdrojové kódy klasifikátoru jsou dostupné na github https://github.com/vodev/vocloud-deeplearning a big data layer pro framework Caffe na url https://github.com/atheiste/caffe/tree/big_data_layer | cze |
dc.description.abstract | Modern astronomy and all natural sciences are dealing with exponentially increasing amounts of data. This phenomena resulted in the penetration of computer science into pure natural sciences. In the case of contemporary astronomy, this led to the creation of a new field called astroinformatics. This thesis is a case study of modern parallel machine learning algorithms and their usage on astronomical big data. It resulted into deep neural network classifiers running on graphical processors and built on top of Caffe framework. An efficient input layer was added into Caffe so it is possible to use standard flat files for big data. The classifier comes with two pre-trained models to fit tabular and raw spectral data. The model for raw spectra is a two layered convolutional network whose accuracy is over 99\% and average dataflow 1440 MB/s. The source code of our classifier is available on github https://github.com/vodev/vocloud-deeplearning and the big data layer for Caffe framework at https://github.com/atheiste/caffe/tree/big_data_layer | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf | cze |
dc.subject | strojové učení, klasifikace, hluboké neuronové sítě, GPU, astroinformatika, caffe | cze |
dc.title | Strojové učení v astroinformatice s použitím masivně paralelního zpracování dat | cze |
dc.title | Machine Learning in Astroinformatics Using Massively Parallel Data Processing | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.date.accepted | 2015-06-10 | |
dc.contributor.referee | Šimeček Ivan | |
theses.degree.discipline | Znalostní inženýrství | cze |
theses.degree.grantor | katedra teoretické informatiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18101 [208]