Odhad atributů z tváře
Facial Attribute Prediction
Typ dokumentu
diplomová prácemaster thesis
Autor
Marčišin Matej
Vedoucí práce
Franc Vojtěch
Oponent práce
Urban Martin
Studijní obor
Datové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
V tejto práci navrhujeme postup na trénovavnie konvolučnej neurónovej siete (CNN). Na rozdiel od bežnej konvolučnej neurónovej siete, navrhujeme jeden model schopný simultánnej predikcie viacerých atribútov z tváre človeka. Proces trénovania parametrov pre CNN formulujeme metódou maximalizácie vierohodnosti. Takto definované učenie nám umožňuje sa učiť z plne anotovaných príkladov, ako aj z neúplnej anotácie. Tento postup experimentálne overujeme a porovnávame jeho kvalitu voči štandardnému prístupu, kde jeden model konvolučnej siete produkuje jeden odhad. Nami navrhnutý model model dosahuje v predikciách atributov z tváre lepšie výsledky ako skupina ľudí a porovnateľné výsledky s najpokročilejšími algoritmami v našej doméne. Na záver sme overili schopnosť navrhnutého modelu učiť sa z neúplnej heterogénnej anotácie, ktorá sa bežne vyskytuje v praxi. In this thesis we propose a method for learning single CNN model performing multiple prediction tasks simultaneously. We formulate learning of the model parameters in the Maximum-Likelihood framework which allows to learn from both fully annotated and partially annotated examples. The proposed method is evaluated on the problem of prediction of attributes from an image of human face. We experimentally show that the proposed multi-task prediction model has the same performance as an ensemble of independent CNN models each trained to perform a single prediction task. The proposed multi-task model achieves super-human performance and it is comparable to the current state-of-the-art methods. In addition we verified that the proposed method can learn from multiple datasets with heterogeneous annotation of the attributes being the scenario often encountered in practice.
Kolekce
- Diplomové práce - 13136 [833]