Face Interpretation Problems on Low Quality Images
Úlohy interpretace obličeje na obrázcích nízké kvality
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
Automatický odhad věku a pohlaví má potenciální reálné aplikace (např. sledovaní osob, komerční profilování, apod.). Často jsou ale k dispozici pouze obrázky s nízkým rozlišením. Cílem této práce je porovnat základní klasifikátor věku a pohlaví, který byl trénován na obrázcích vysoké kvality, se dvěma navrhovanými strategiemi pro zlepšení přesnosti predikce na obrázcích nízkého rozlišení. (1) Rozšíření datové sady, které adaptuje základní CNN klasifikátor věku a pohlaví pomocí syntézy obrázků nízkého rozlišení. (2) Superrozlišení vylepšuje rozlišení za použití podmíněné generativní adversariální sítě a věk a pohlaví se následně odhadují za použití základního CNN klasifikátoru. Na rozdíl od metody rozšíření dat tento mezikrok poskytuje interpretaci výsledků srozumitelnou pro člověka. Experimenty ukazují, že obě zmíněné strategie překonaly základní metodu a opravdu zlepšují přesnost predikce na obrázcích nízkého rozlišení. Se srovnatelným počtem trénovacích dat poskytuje superrozlišení znatelně lepší výsledky.
Automatic age and gender prediction is applicable in many real-world problems (e.g. surveillance, commercial profiling, etc.). Often, only low-resolution(LR) images are available. The goal of the thesis is to compare a baseline CNN age and gender predictor trained on high-quality images with two proposed strategies for improving prediction accuracy on low-resolution images: (1) Data-augmentation strategy trains a CNN classifier on synthetically generated LR images. (2) Super-resolution strategy enhances image resolution using conditional generative adversarial network (cGAN) and the age and gender prediction is subsequently made using the baseline CNN. The intermediate step provides human-readable interpretation, unlike in the case of data-augmentation. The experiments show that both methods outperformed the baseline method and indeed improve prediction accuracy on LR images. The super-resolution noticeably exceeding the data-augmentation given comparable amount of training data.
Automatic age and gender prediction is applicable in many real-world problems (e.g. surveillance, commercial profiling, etc.). Often, only low-resolution(LR) images are available. The goal of the thesis is to compare a baseline CNN age and gender predictor trained on high-quality images with two proposed strategies for improving prediction accuracy on low-resolution images: (1) Data-augmentation strategy trains a CNN classifier on synthetically generated LR images. (2) Super-resolution strategy enhances image resolution using conditional generative adversarial network (cGAN) and the age and gender prediction is subsequently made using the baseline CNN. The intermediate step provides human-readable interpretation, unlike in the case of data-augmentation. The experiments show that both methods outperformed the baseline method and indeed improve prediction accuracy on LR images. The super-resolution noticeably exceeding the data-augmentation given comparable amount of training data.