Facial Attribute Prediction

Odhad atributů z tváře

Research Projects

Organizational Units

Journal Issue

Abstract

V tejto práci navrhujeme postup na trénovavnie konvolučnej neurónovej siete (CNN). Na rozdiel od bežnej konvolučnej neurónovej siete, navrhujeme jeden model schopný simultánnej predikcie viacerých atribútov z tváre človeka. Proces trénovania parametrov pre CNN formulujeme metódou maximalizácie vierohodnosti. Takto definované učenie nám umožňuje sa učiť z plne anotovaných príkladov, ako aj z neúplnej anotácie. Tento postup experimentálne overujeme a porovnávame jeho kvalitu voči štandardnému prístupu, kde jeden model konvolučnej siete produkuje jeden odhad. Nami navrhnutý model model dosahuje v predikciách atributov z tváre lepšie výsledky ako skupina ľudí a porovnateľné výsledky s najpokročilejšími algoritmami v našej doméne. Na záver sme overili schopnosť navrhnutého modelu učiť sa z neúplnej heterogénnej anotácie, ktorá sa bežne vyskytuje v praxi.

In this thesis we propose a method for learning single CNN model performing multiple prediction tasks simultaneously. We formulate learning of the model parameters in the Maximum-Likelihood framework which allows to learn from both fully annotated and partially annotated examples. The proposed method is evaluated on the problem of prediction of attributes from an image of human face. We experimentally show that the proposed multi-task prediction model has the same performance as an ensemble of independent CNN models each trained to perform a single prediction task. The proposed multi-task model achieves super-human performance and it is comparable to the current state-of-the-art methods. In addition we verified that the proposed method can learn from multiple datasets with heterogeneous annotation of the attributes being the scenario often encountered in practice.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By