Implementace rychlé Fourierovy transformace v technologii CUDA
Implementation of Fast Fourier Transforms in CUDA Technology
Typ dokumentu
diplomová prácemaster thesis
Autor
Martin Horský
Vedoucí práce
Šimeček Ivan
Oponent práce
Oberhuber Tomáš
Studijní obor
Počítačové systémy a sítěStudijní program
InformatikaInstituce přidělující hodnost
katedra počítačových systémůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce obsahuje teoretický rozbor DFT, FFT a Cooley-Tukey algoritmu. Obsahuje rozbor způsobů paralelizace a vlastností paralelních architektur a hlubší popis vývojové platformy CUDA pro použití grafických karet Nvidia pro obecné výpočty. Následně popisuje postup vývoje implementace FFT při použití platformy CUDA a rozebírá jednotlivé použité optimalizace. Závěrem popisuje měření výkonnosti a porovnávání jednotlivých implementovaných optimalizací a srovnává výslednou verzi programu s existujícími knihovnami pro výpočet DFT. This thesis contains a theoretical overview of DFT, FFT and the Cooley-Tukey algorithm. It contains an analysis of methods of paralelization, properties of parallel architectures and a deeper description of the CUDA development platform used for generel computations on Nvidia graphics cards. Then it describes development of implementation of FFT using the CUDA platform and describes each seperate optimization used. Lastly it contains measurements of comuptaional performence and compares implemented optimizations. It also compares the resulting implementation with existing libraries for DFT.
Kolekce
- Diplomové práce - 18104 [174]