Versatile Foundation Model for Face Recognition
| dc.contributor.advisor | Franc, Vojtěch | |
| dc.contributor.author | Bencko, Martin | |
| dc.contributor.referee | Čech, Jan | |
| dc.date.accessioned | 2025-06-05T22:58:35Z | |
| dc.date.available | 2025-06-05T22:58:35Z | |
| dc.date.issued | 2025-06-05 | |
| dc.description.abstract | Tato práce se zabývá problémem trénování multitask modelu schopného odhadovat věk, určovat pohlaví a ověřovat identitu, přičemž využívá foundation modely. Tento úkol je komplikován nedostatkem dostatečně rozsáhlých datasetů, které by obsahovaly všechny potřebné anotace pro trénování multitask modelu. K překonání tohoto problému navrhujeme metodu multitask trénování bez nutnosti použití anotovaných dat, založenou na model distillation. Model student je trénován pomocí predikcí dvou specializovaných učitelských modelů: jednoho pro ověření identity a druhého pro odhad věku a predikci pohlaví. Dále představujeme novou metodu pro sledování průběhu trénování verifikačních modelů, kterou nazýváme inverted running per-batch AUC (irAUC). Analyzujeme také dataset LAION-Face, který byl použit k trénování foundation modelu FaRL, abychom vysvětlili jeho omezený výkon v úloze ověření identity. Naše experimenty ukazují, že je nejen možné destilovat úlohy ověření identity, odhad věku a predikci pohlaví společně, ale že tento přístup může vést ke zlepšení výkonu predikcí věk-pohlaví. Ověření identity u multitask modelů hodnotíme pomocí protokolu IJB-C, přičemž dosahujeme slibných výsledků. | cs |
| dc.description.abstract | This thesis addresses the challenge of training a multitask model capable of age estimation, gender prediction, and identity verification, while leveraging foundation models. A major obstacle is the lack of sufficiently large datasets annotated for all three tasks, which complicates end-to-end training of such models. To overcome this, we propose a method for multitask training without the need for labeled data, using model distillation. A student model is trained based on the outputs of two specialized teacher models: one for identity verification and the other for age and gender prediction. Additionally, we introduce a novel validation metric for monitoring verification model training, termed inverted running per-batch AUC (irAUC). To investigate the limitations of the foundational model FaRL in identity verification, we perform a lexical analysis of its pretraining dataset, LAION-Face. Our experiments show that joint distillation of identity and age-gender tasks is not only feasible but can also enhance performance, particularly in age and gender prediction. The identity verification capabilities of the resulting multitask models are evaluated using the IJB-C protocol, demonstrating promising results. | en |
| dc.identifier | KOS-1243747923205 | |
| dc.identifier.uri | http://hdl.handle.net/10467/122566 | |
| dc.publisher | České vysoké učení technické v Praze | cs |
| dc.publisher | Czech Technical University in Prague | en |
| dc.rights | A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. | en |
| dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. | cs |
| dc.subject | foundation model | cs |
| dc.subject | verifikace identity | cs |
| dc.subject | odhad věku | cs |
| dc.subject | predikce pohlaví | cs |
| dc.subject | destilace modelů | cs |
| dc.subject | foundation model | en |
| dc.subject | identity verification | en |
| dc.subject | age estimation | en |
| dc.subject | gender prediction | en |
| dc.subject | model distillation | en |
| dc.title | Univerzální model pro rozpoznávání obličejů | cs |
| dc.title | Versatile Foundation Model for Face Recognition | en |
| dc.type | bachelor thesis | en |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | ac558c56-8ead-4786-82b0-7e4048101fc7 | |
| relation.isAdvisorOfPublication.latestForDiscovery | ac558c56-8ead-4786-82b0-7e4048101fc7 | |
| relation.isAuthorOfPublication | 2e6342d1-fe91-4010-87f1-7382d50016d5 | |
| relation.isAuthorOfPublication.latestForDiscovery | 2e6342d1-fe91-4010-87f1-7382d50016d5 | |
| relation.isRefereeOfPublication | 28ac19ad-52c9-4703-8b26-7eef2e012ffa | |
| relation.isRefereeOfPublication.latestForDiscovery | 28ac19ad-52c9-4703-8b26-7eef2e012ffa | |
| theses.degree.discipline | Základy umělé inteligence a počítačových věd | cs |
| theses.degree.grantor | katedra kybernetiky | cs |
| theses.degree.programme | Otevřená informatika | cs |
Files
Original bundle
1 - 3 of 3
- Name:
- F3-BP-2025-Bencko-Martin-Versatile_Foundation_Model_for_Face_Recognition.pdf
- Size:
- 2.76 MB
- Format:
- Adobe Portable Document Format
- Description:
- PLNY_TEXT
- Name:
- F3-BP-2025-posudek-Franc_Vojtech.pdf
- Size:
- 129.03 KB
- Format:
- Adobe Portable Document Format
- Description:
- POSUDEK
- Name:
- F3-BP-2025-posudek-Cech_Jan.pdf
- Size:
- 217.1 KB
- Format:
- Adobe Portable Document Format
- Description:
- POSUDEK