Face Interpretation Problems on Low Quality Images

Úlohy interpretace obličeje na obrázcích nízké kvality

Supervisors

Reviewers

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Research Projects

Organizational Units

Journal Issue

Abstract

Automatický odhad věku a pohlaví má potenciální reálné aplikace (např. sledovaní osob, komerční profilování, apod.). Často jsou ale k dispozici pouze obrázky s nízkým rozlišením. Cílem této práce je porovnat základní klasifikátor věku a pohlaví, který byl trénován na obrázcích vysoké kvality, se dvěma navrhovanými strategiemi pro zlepšení přesnosti predikce na obrázcích nízkého rozlišení. (1) Rozšíření datové sady, které adaptuje základní CNN klasifikátor věku a pohlaví pomocí syntézy obrázků nízkého rozlišení. (2) Superrozlišení vylepšuje rozlišení za použití podmíněné generativní adversariální sítě a věk a pohlaví se následně odhadují za použití základního CNN klasifikátoru. Na rozdíl od metody rozšíření dat tento mezikrok poskytuje interpretaci výsledků srozumitelnou pro člověka. Experimenty ukazují, že obě zmíněné strategie překonaly základní metodu a opravdu zlepšují přesnost predikce na obrázcích nízkého rozlišení. Se srovnatelným počtem trénovacích dat poskytuje superrozlišení znatelně lepší výsledky.

Automatic age and gender prediction is applicable in many real-world problems (e.g. surveillance, commercial profiling, etc.). Often, only low-resolution(LR) images are available. The goal of the thesis is to compare a baseline CNN age and gender predictor trained on high-quality images with two proposed strategies for improving prediction accuracy on low-resolution images: (1) Data-augmentation strategy trains a CNN classifier on synthetically generated LR images. (2) Super-resolution strategy enhances image resolution using conditional generative adversarial network (cGAN) and the age and gender prediction is subsequently made using the baseline CNN. The intermediate step provides human-readable interpretation, unlike in the case of data-augmentation. The experiments show that both methods outperformed the baseline method and indeed improve prediction accuracy on LR images. The super-resolution noticeably exceeding the data-augmentation given comparable amount of training data.

Description

Citation

Endorsement

Review

Supplemented By

Referenced By