Syntéza lidské tváře pro rozšíření trénovací množiny
Human face synthesis for dataset augmentation
Typ dokumentu
diplomová prácemaster thesis
Autor
Matěj Nikl
Vedoucí práce
Franc Vojtěch
Oponent práce
Urban Martin
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Pro trénování konvoluční neuronové sítě (CNN) pro odhad věku z obrázků tváří je potřeba velké množství trénovacích dat. Protože volně dostupné datové sady mají určité věkové kategorie nedostatečně zastoupené, konvoluční sítě se je nemohou naučit odhadovat dostatečně dobře. Jedním z řešení tohoto problému by mohla být naše metoda pro syntézu nových obrázků tváří -- nových identit. Nové příklady tvoří kombinováním vzhledu a tvaru několika částí kompatibilních tváří. Vzhledem k tomu, že takovéto části vždy pochází z tváří stejného věku a pohlaví, vytvořená syntetická tvář si tyto atributy zachovává. Naši metodu hodnotíme pomocí konvoluční neuronové sítě a na datasetu MORPH. Pomocí hrubé síly se pak pokoušíme najít nejvhodnější hyper-parametry naší metody. Následně sledujeme hodnoty několika metrik konvoluční sítě trénované a vyhodnocované v různých podmínkách.Naneštěstí se nám nedaří pozorovat významné zlepšení, zapříčiněné naší metodou. Naší hypotézou je, že konvoluční neuronové sítě se v úloze odhadování věku naučí ignorovat korelace mezi částmi obličejů. Z toho důvodu syntetické příklady získané permutací částí tváří z již přítomných trénovacích dat nezlepšují konvoluční síti schopnost zobecňovat na nové identity. Training a Convolutional Neural Network (CNN) for the task of age prediction from face images requires large amounts of training data. As the freely available datasets are underrepresented for certain age categories, the CNNs cannot learn to recognize them well enough. We propose a solution to this problem by introducing a method for synthesis of new face images -- of virtual identities. It creates new examples by merging appearance and shape of several compatible face parts together. Since the face parts always come from faces of the same age and gender, the synthetic example retains these attributes. We evaluate our method using a CNN and on the MORPH dataset. We try to find the best hyper-parameters of our method by performing an exhaustive search. Then, we train and evaluate the CNN in various settings, while measuring its performance using several metrics. Sadly, we observe no significant improvement using our augmentation method. We hypothesize that CNNs are able to learn themselves that the correlation between face parts can be safely ignored for the age recognition task. Hence synthetic examples obtained by permutation of face parts already contained in the training data do not improve generalization of the CNN.
Kolekce
- Diplomové práce - 13136 [833]