Implementation and comparison of formats for storage of sparse matrices in TNL library
Implementace a porovnání formátů pro ukládání řídkých matic v knihovně TNL
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Bakalářská práce se zabývá problematikou násobení řídkých matic s vektorem na grafických kartách. Byla přidána implementace různých algoritmů do projektu TNL zejména pro formát CSR. Mezi všemi implementacemi bylo provedeno porovnání jejich výkonu. Výkonnostní testy ukázaly, že efektivita výpočtů pro tento formát silně závisí na zvoleném algoritmu pro určitý vzor zaplnění matice. Rozdíl mezi různými algoritmy pro určité matice může být větší než desetinásobný. Některé implementace byly postupně vylepšeny a každá změna byla zanalyzována z hlediska jejího vlivu na výkon. Navíc, práce obsahuje porovnání formátu CSR s jinými podporovanými formáty v knihovně TNL.
This Bachelor thesis focuses on sparse matrix-vector multiplication on GPU. Implementation of various algorithms has been added to the TNL library mainly for CSR format. A comparison of their performance has been conducted among all the implementations. As this research has shown, the calculation efficiency for this format profoundly depends on a selected algorithm for a specific matrix type. In some cases, it was possible to achieve more than 10-fold performance growth. Some implementations have been gradually improved; moreover, every change has been analyzed in terms of their impact on performance. In addition, this thesis contains a comparison of CSR format to other formats that are supported by the TNL library.
This Bachelor thesis focuses on sparse matrix-vector multiplication on GPU. Implementation of various algorithms has been added to the TNL library mainly for CSR format. A comparison of their performance has been conducted among all the implementations. As this research has shown, the calculation efficiency for this format profoundly depends on a selected algorithm for a specific matrix type. In some cases, it was possible to achieve more than 10-fold performance growth. Some implementations have been gradually improved; moreover, every change has been analyzed in terms of their impact on performance. In addition, this thesis contains a comparison of CSR format to other formats that are supported by the TNL library.
Description
Keywords
grafické karty, GPU, formát CSR, Compute Unified Device Architecture, CUDA, násobení řídké matice s vektorem, Template Numerical Library, TNL, C++, optimalizace, High Performance Computing, HPC, graphic cards, GPU, CSR format, Compute Unified Device Architecture, CUDA, sparse matrix-vector multiplication, Template Numerical Library, TNL, C++, optimisation, High Performance Computing, HPC
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.