Přesnost 3D odhadu polohy a tvaru těla kojenců z RGB a RGB-D dat
Accuracy of 3D body pose and shape estimation of infants from RGB and RGB-D data
Typ dokumentu
diplomová prácemaster thesis
Autor
Vojtěch Volprecht
Vedoucí práce
Hoffmann Matěj
Oponent práce
Hesse Nikolas
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato práce zkoumá schopnosti vnímání hloubky tří RGB-D kamer, konkrétně Intel RealSense D435, D455 a ZED 2i na statické i dynamické objekty s cílem zlepšit neinvazivní diagnostiku psychomotorických postižení, jako je dětská mozková obrna. Provedli jsme nahrávky tří kojenců pomocí RGB-D kamer a motion capture systému jakožto reference. Kromě analýzy hloubkového vnímání jsme použili 2D a 3D odhad polohy pomocí současných modelů, konkrétně MediaPipe, ViTPose a ZED Native. Porovnáním výsledků z RGB-D kamer a modelů doporučujeme optimální dvojici kamera-model pro nejefektivnější přístup k přesnému a spolehlivému odhadu polohy kojence. This study investigates the depth perception capabilities of three RGB-D cameras, namely Intel RealSense D435, D455, and ZED 2i on both static and dynamic objects, aiming to enhance the non-invasive diagnosis of psychomotor disabilities such as cerebral palsy in infants. We conducted recordings of three infants, using RGB-D cameras and a motion capture system as the ground truth reference. In addition to depth perception analysis, we employed 2D and 3D pose estimation with current state-of-the-art models, specifically MediaPipe, ViTPose and ZED Native. By comparing the results from RGB-D cameras and models, we aimed to recommend the optimal pair camera-model for the most effective approach for precise and reliable pose estimation of infant.
Kolekce
- Diplomové práce - 13136 [966]