Strojové učení v astroinformatice s použitím masivně paralelního zpracování dat
Machine Learning in Astroinformatics Using Massively Parallel Data Processing
Typ dokumentu
diplomová prácemaster thesis
Autor
Peterka Tomáš
Vedoucí práce
Škoda Petr
Oponent práce
Šimeček Ivan
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra teoretické informatikyObhájeno
2015-06-10Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Moderní astronomie a ostatní oblasti přírodních věd se potýkají s exponenciál-ně rostoucím objemem
dat. Tento fenomén vedl k průniku počítačových věd do oblasti těchto čistě přírodních věd. V případě
současné astronomie hovoříme o takzvané astroinformatice.
Tato práce je přehlídkou nejmodernějších paralelních algoritmů strojového učení a jejich použití na
astronomických velkých datech. Sestrojili jsme klasifikátory založené na hlubokých neuronových
sítích schopných běžet na grafi-ckých procesorech za použití Caffe frameworku. Vyvinuli jsme
efektivní vstupní vrstvu pro Caffe modely, která je schopná pracovat s obecnými textovými soubory a
má velmi intuitivní konfiguraci. Za použití klasifikátoru jsme natré-novali dva modely podle
vzorových dat. Model pro spektra je dvouvrstvá konvoluční síť s přesností klasifikace přes 99\% a
průměrnou propustností 1440 MB/s.
Zdrojové kódy klasifikátoru jsou dostupné na github https://github.com/vodev/vocloud-deeplearning
a big data layer pro framework Caffe na url https://github.com/atheiste/caffe/tree/big_data_layer Modern astronomy and all natural sciences are dealing with exponentially increasing amounts of data. This phenomena resulted in the penetration of computer science into pure natural sciences. In the case of contemporary astronomy, this led to the creation of a new field called astroinformatics.
This thesis is a case study of modern parallel machine learning algorithms and their usage on
astronomical big data. It resulted into deep neural network classifiers running on graphical
processors and built on top of Caffe framework. An efficient input layer was added into Caffe so it
is possible to use standard flat files for big data. The classifier comes with two pre-trained
models to fit tabular and raw spectral data. The model for raw spectra is a two layered convolutional
network whose accuracy is over 99\% and average dataflow 1440 MB/s.
The source code of our classifier is available on github https://github.com/vodev/vocloud-deeplearning and the big data layer for Caffe framework at https://github.com/atheiste/caffe/tree/big_data_layer
Kolekce
- Diplomové práce - 18101 [216]