Efektivní kódování obrazu založené na učení
Efficient Learning Based Image Coding
Typ dokumentu
diplomová prácemaster thesis
Autor
Daniel Šafář
Vedoucí práce
Fliegel Karel
Oponent práce
Polák Ladislav
Studijní obor
Audiovizuální technika a zpracování signálůStudijní program
Elektronika a komunikaceInstituce přidělující hodnost
katedra radioelektronikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato diplomová práce se věnuje efektivní kompresi obrazu s využitím strojového učení. Nejprve je představen stručný úvod do neuronových sítí a strojového učení, na který navazuje podrobnější rozbor jejich využití v kompresi obrazu, a to od nejstarších pokusů až po současné aktivity JPEG AI. Součástí teoretické části práce je také přehled dostupných softwarových implementací a nástrojů hlubokého učení. Dále je zařazena kapitola věnující se latentní reprezentaci obrazových dat, která z komprese založené na učení vychází. Významnou částí práce je provedení experimentu porovnávajícího konvenční obrazové kodeky (JPEG, JPEG 2000, HEVC Intra a JPEG XL) a několik metod založených na učení zejména s ohledem na kompresní účinnost. Porovnání je provedeno na vybraných testovacích datech pomocí několika metrik (PSNR, MS-SSIM, VIFP, PSNR-HVS-M, FSIMc a VMAF), přičemž výstupem jsou R–D (Rate–Distortion) křivky a integrální porovnání kompresní účinnosti kodeků pomocí Bjøntegaardovy metriky. This master thesis is devoted to efficient image compression with the use of maachine learning. A brief introduction to neural networks and machine learning is presented, then more detailed analysis on the utilization of them in image compression is conducted, namely from the first attempts to the context of ongoing JPEG AI activities. An overview of current available software implementations and deep learning tools is also provided in the theoretical part of the thesis. Then, there is a chapter devoted to latent representation of image data, which is based on learning based image compression. The key part of the thesis is an experiment comparing conventional image codecs (JPEG, JPEG 2000, HEVC Intra and JPEG XL) and several learning based methods with emphasis on compression efficiency. The comparison is performed on selected test data with several metrics (PSNR, MS-SSIM, VIFP, PSNR-HVS-M, FSIMc and VMAF). The output of the experiment are the R–D (Rate–Distortion) curves and integral comparison of compression efficiency based on Bjøntegaard metric.
Kolekce
- Diplomové práce - 13137 [258]