Jemnozrnné rozpoznávání zvířat v reálném prostředí
Fine-grained recognition of animals in the wild
Type of document
disertační prácedoctoral thesis
Author
Vojtěch Čermák
Supervisor
Neumann Lukáš
Opponent
Šroubek Filip
Field of study
Informatika - Katedra kybernetikyStudy program
InformatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Identifikace jednotlivých zvířat je klíčová pro výzkum a ochranu divoké přírody, protože umožňuje sledování, analýzu chování a monitorování populací zvířat. Tradiční metody identifikace, jako je manuální značkovaní, jsou však časově náročné a nepraktické pro rozsáhlé studie. S rostoucí dostupností velkých datových souborů z fotopastí a občanské vědy se proto automatizace tohoto procesu pomocí strojového učení stala nezbytnou. Tato práce zkoumá identifikaci zvířat jako problém počítačového vidění a řeší klíčové výzvy, jako je závislost na detailních rysech, nevyváženost tříd, variabilita prostředí a omezená dostupnost dat. Cílem této práce je zlepšit metody automatizované identifikace, aby byly přesnější, škálovatelné a robustní pro reálné aplikace. Klíčovým přínosem je knihovna WildlifeDatasets, open-source nástroj pro přístup k datasetům pro identifikaci zvířat, spolu s WildlifeTools, sadou metod a nástrojů navržených pro zvýšení replikovatelnosti a transparentnosti výzkumu. Dále představujeme dataset SeaTurtleID, který obsahuje časová razítka a pokrývá dlouhé časové období. Pomocí tohoto datasetu demonstrujeme význam realistického rozdělení trénovacích a testovacích dat, aby se zajistilo nestranné hodnocení. Navíc představujeme MegaDescriptor, základní model hlubokého učení pro identifikaci zvířat, který funguje napříč více druhy a překonává stávající metody. Nakonec navrhujeme WildFusion, hybridní přístup, který kombinuje lokální párování rysů s hlubokým učením prostřednictvím kalibrované fúze podobností, čímž zlepšuje jak přesnost, tak výpočetní efektivitu. Identifying individual animals is crucial for wildlife research and conservation, enabling tracking, behavior analysis, and population monitoring. However, traditional animal identification methods, such as tagging and manual inspection, are labor-intensive and impractical for large-scale studies. Automating this process using machine learning has become essential with the increasing availability of large datasets from camera traps and citizen science. This thesis explores animal identification as a computer vision problem, addressing key challenges such as reliance on fine-grained features, class imbalance, environmental variability, and limited data availability. The goal of this work is to improve automated identification methods, making them more accurate, scalable, and robust for real-world applications. A key contribution is the WildlifeDatasets library, an open-source toolkit for accessing animal identification datasets, alongside WildlifeTools, a suite of methods and tools designed to enhance research replicability and transparency. We also introduce the SeaTurtleID dataset, which includes timestamps and spans a long duration. Using this dataset, we demonstrate the importance of realistic training and evaluation splits to prevent data leakage and ensure unbiased evaluation. Additionally, we present MegaDescriptor, a foundational deep learning model for animal identification that works across multiple species and outperforms existing methods. Finally, we propose WildFusion, a hybrid approach that integrates local feature matching with deep learning through calibrated similarity fusion, improving both accuracy and computational efficiency.
View/ Open
Collections
- Disertační práce - 13000 [743]