Show simple item record

Machine Learning in Astroinformatics Using Massively Parallel Data Processing

dc.contributor.advisorŠkoda Petr
dc.contributor.authorPeterka Tomáš
dc.date.accessioned2016-02-25T14:52:42Z
dc.date.available2016-02-25T14:52:42Z
dc.identifierKOS-541818247905
dc.identifier.urihttp://hdl.handle.net/10467/62747
dc.description.abstractModerní astronomie a ostatní oblasti přírodních věd se potýkají s exponenciál-ně rostoucím objemem dat. Tento fenomén vedl k průniku počítačových věd do oblasti těchto čistě přírodních věd. V případě současné astronomie hovoříme o takzvané astroinformatice. Tato práce je přehlídkou nejmodernějších paralelních algoritmů strojového učení a jejich použití na astronomických velkých datech. Sestrojili jsme klasifikátory založené na hlubokých neuronových sítích schopných běžet na grafi-ckých procesorech za použití Caffe frameworku. Vyvinuli jsme efektivní vstupní vrstvu pro Caffe modely, která je schopná pracovat s obecnými textovými soubory a má velmi intuitivní konfiguraci. Za použití klasifikátoru jsme natré-novali dva modely podle vzorových dat. Model pro spektra je dvouvrstvá konvoluční síť s přesností klasifikace přes 99\% a průměrnou propustností 1440 MB/s. Zdrojové kódy klasifikátoru jsou dostupné na github https://github.com/vodev/vocloud-deeplearning a big data layer pro framework Caffe na url https://github.com/atheiste/caffe/tree/big_data_layercze
dc.description.abstractModern astronomy and all natural sciences are dealing with exponentially increasing amounts of data. This phenomena resulted in the penetration of computer science into pure natural sciences. In the case of contemporary astronomy, this led to the creation of a new field called astroinformatics. This thesis is a case study of modern parallel machine learning algorithms and their usage on astronomical big data. It resulted into deep neural network classifiers running on graphical processors and built on top of Caffe framework. An efficient input layer was added into Caffe so it is possible to use standard flat files for big data. The classifier comes with two pre-trained models to fit tabular and raw spectral data. The model for raw spectra is a two layered convolutional network whose accuracy is over 99\% and average dataflow 1440 MB/s. The source code of our classifier is available on github https://github.com/vodev/vocloud-deeplearning and the big data layer for Caffe framework at https://github.com/atheiste/caffe/tree/big_data_layereng
dc.language.isoENG
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf.eng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf.cze
dc.subjectstrojové učení, klasifikace, hluboké neuronové sítě, GPU, astroinformatika, caffecze
dc.titleStrojové učení v astroinformatice s použitím masivně paralelního zpracování datcze
dc.titleMachine Learning in Astroinformatics Using Massively Parallel Data Processingeng
dc.typediplomová prácecze
dc.typemaster's thesiseng
dc.date.accepted2015-06-10
dc.contributor.refereeŠimeček Ivan
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra teoretické informatikycze
theses.degree.programmeInformatikacze


Files in this item




This item appears in the following Collection(s)

Show simple item record