Geometrie a tranformace v hlubokých konvolučních neuronových sítích

Jakab Tomáš

Geometry and Transformations in Deep Convolutional Neural Networks

dc.contributor.advisor	Vedaldi Andrea
dc.contributor.author	Jakab Tomáš
dc.date.accessioned	2016-06-05T09:41:25Z
dc.date.available	2016-06-05T09:41:25Z
dc.date.issued	2016-05-27
dc.identifier	KOS-587864888205
dc.identifier.uri	http://hdl.handle.net/10467/64745
dc.description.abstract	Tato práce zkoumá jak klasifikační chyba hlubokých konvolučních sítí (CNN) používaných pro verifikaci obrázků závisí na transformaci mezi dvěma vizuálně podobnými obrázky. Inspirování výzkumem v experimentální psychologii, který se domnívá, že lidé řeší takovéto úlohy pomocí mentální rotace pozorovaných objektů, chceme ověřit, jestli zabudování takovéhoto mechanismu do neuronových sítí vylepší jejich klasifikační přesnost. Kontréně uvažujeme 2D rotace a translace. V této práci ukážeme, že v případě rotace je nejnižší chybovost dosažena, pokud jsou oba obrázky zarovnány. Další minima jsou při 90 a 180 stupních rotace mezi dvěma vstupy. Nejnižší chybovost v připadě žádné rotace je navíc podpořena dalšími výsledky ukazujícími, že použití mechanismu "mentální rotace" před tím, než jsou obrázky poslány do verifikační neuronové sítě, výrazně zlepší klasifikační přesnost jednoduché CNN. Nakonec kvalitativně vyšetříme hluboké reprezentace za použití metod pro invereze reprezentací. Díky tomu jsme objevili invariantní vlastnosti reprezentací z první plně propojené vrstvy (FC1), která se adaptovala na rotace vstupního obrázku. Na základě našich dalších výsledků se domníváme, že v sítích trénovaných pro predikci rotace mezi dvěma obrázky, se FC1 reprezentace implicitně naučí korespondece mezi dvěma rotovanými obrázky.	cze
dc.description.abstract	In this work, we investigate how the classification error of deep convolutional neural networks (CNNs) used for image verification depends on transformations between two visually similar inputs. Furthermore, inspired by research in experimental psychology suggesting that humans solve such a task by mentally rotating the observed objects, we test whether building such a mechanism into artificial neural networks improves their performance. For transformations, we consider 2D rotations and translations. We show that, in the case of rotation, the lowest error is achieved when the two inputs are aligned, followed by two minima for rotations of 90 and 180 degrees, although the difference is small for standard architectures. The difference is much more pronounced when "mental rotations", implemented by means of resampling and spatial transformer layers, are introduced in the architecture, significantly improving the performance of the vanilla architecture. Finally, we qualitatively probe deep features using a method for feature inversion. We discovered invariant properties of the first fully connected layer (FC1) features adapted to input rotation. Our results also suggest that in networks trained to predict rotation between two inputs, the FC1 features implicitly learn to establish correspondences between corner points in the rotated inputs.	eng
dc.language.iso	ENG
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf	cze
dc.subject	konvoluční neuronové sítě; geometrie; geometrické transformace; rotace; translace; invariance; verifikace obrázků; korespondece	cze
dc.subject	convolutional neural network; CNN; geometry; geometric transformation; rotation; translation; invariance; image verification; correspondence	eng
dc.title	Geometrie a tranformace v hlubokých konvolučních neuronových sítích	cze
dc.title	Geometry and Transformations in Deep Convolutional Neural Networks	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.date.accepted
dc.contributor.referee	Mishkin Dmytro
theses.degree.discipline	Informatika a počítačové vědy	cze
theses.degree.grantor	katedra kybernetiky	cze
theses.degree.programme	Otevřená informatika	cze

Soubory tohoto záznamu

Název:: F3-BP-2016-Jakab-Tomas-jakab16 ...
Velikost:: 2.018Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-BP-2016-Jakab-Tomas-priloha ...
Velikost:: 37.64Kb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: MU-BP-2016-posudek-Vedaldi_And ...
Velikost:: 92.09Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: MU-BP-2016-posudek-Mishkin_Dmy ...
Velikost:: 447.2Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 13133 [777]

Zobrazit minimální záznam