Versatile Foundation Model for Face Recognition

dc.contributor.advisor Franc, Vojtěch
dc.contributor.author Bencko, Martin
dc.contributor.referee Čech, Jan
dc.date.accessioned 2025-06-05T22:58:35Z
dc.date.available 2025-06-05T22:58:35Z
dc.date.issued 2025-06-05
dc.description.abstract Tato práce se zabývá problémem trénování multitask modelu schopného odhadovat věk, určovat pohlaví a ověřovat identitu, přičemž využívá foundation modely. Tento úkol je komplikován nedostatkem dostatečně rozsáhlých datasetů, které by obsahovaly všechny potřebné anotace pro trénování multitask modelu. K překonání tohoto problému navrhujeme metodu multitask trénování bez nutnosti použití anotovaných dat, založenou na model distillation. Model student je trénován pomocí predikcí dvou specializovaných učitelských modelů: jednoho pro ověření identity a druhého pro odhad věku a predikci pohlaví. Dále představujeme novou metodu pro sledování průběhu trénování verifikačních modelů, kterou nazýváme inverted running per-batch AUC (irAUC). Analyzujeme také dataset LAION-Face, který byl použit k trénování foundation modelu FaRL, abychom vysvětlili jeho omezený výkon v úloze ověření identity. Naše experimenty ukazují, že je nejen možné destilovat úlohy ověření identity, odhad věku a predikci pohlaví společně, ale že tento přístup může vést ke zlepšení výkonu predikcí věk-pohlaví. Ověření identity u multitask modelů hodnotíme pomocí protokolu IJB-C, přičemž dosahujeme slibných výsledků. cs
dc.description.abstract This thesis addresses the challenge of training a multitask model capable of age estimation, gender prediction, and identity verification, while leveraging foundation models. A major obstacle is the lack of sufficiently large datasets annotated for all three tasks, which complicates end-to-end training of such models. To overcome this, we propose a method for multitask training without the need for labeled data, using model distillation. A student model is trained based on the outputs of two specialized teacher models: one for identity verification and the other for age and gender prediction. Additionally, we introduce a novel validation metric for monitoring verification model training, termed inverted running per-batch AUC (irAUC). To investigate the limitations of the foundational model FaRL in identity verification, we perform a lexical analysis of its pretraining dataset, LAION-Face. Our experiments show that joint distillation of identity and age-gender tasks is not only feasible but can also enhance performance, particularly in age and gender prediction. The identity verification capabilities of the resulting multitask models are evaluated using the IJB-C protocol, demonstrating promising results. en
dc.identifier KOS-1243747923205
dc.identifier.uri http://hdl.handle.net/10467/122566
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject foundation model cs
dc.subject verifikace identity cs
dc.subject odhad věku cs
dc.subject predikce pohlaví cs
dc.subject destilace modelů cs
dc.subject foundation model en
dc.subject identity verification en
dc.subject age estimation en
dc.subject gender prediction en
dc.subject model distillation en
dc.title Univerzální model pro rozpoznávání obličejů cs
dc.title Versatile Foundation Model for Face Recognition en
dc.type bachelor thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication ac558c56-8ead-4786-82b0-7e4048101fc7
relation.isAdvisorOfPublication.latestForDiscovery ac558c56-8ead-4786-82b0-7e4048101fc7
relation.isAuthorOfPublication 2e6342d1-fe91-4010-87f1-7382d50016d5
relation.isAuthorOfPublication.latestForDiscovery 2e6342d1-fe91-4010-87f1-7382d50016d5
relation.isRefereeOfPublication 28ac19ad-52c9-4703-8b26-7eef2e012ffa
relation.isRefereeOfPublication.latestForDiscovery 28ac19ad-52c9-4703-8b26-7eef2e012ffa
theses.degree.discipline Základy umělé inteligence a počítačových věd cs
theses.degree.grantor katedra kybernetiky cs
theses.degree.programme Otevřená informatika cs

Files

Original bundle

Now showing 1 - 3 of 3
Name:
F3-BP-2025-Bencko-Martin-Versatile_Foundation_Model_for_Face_Recognition.pdf
Size:
2.76 MB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT
Name:
F3-BP-2025-posudek-Franc_Vojtech.pdf
Size:
129.03 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK
Name:
F3-BP-2025-posudek-Cech_Jan.pdf
Size:
217.1 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK