Rozpoznávání tanečního žánru z videozáznamu páru
Dance Genre Recognition from a Video of a Dancing Pair
Type of document
bakalářská prácebachelor thesis
Author
Štěpán Křivánek
Supervisor
Matas Jiří
Opponent
Hoffmann Matěj
Field of study
Základy umělé inteligence a počítačových vědStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Navrhujeme vylepšení nedávné práce Petra Kouby, která se týká rozpoznávání společenských tanců z videa. Soustředili jsme se výhrádně na vizuální data, a abychom mohli naše výsledky porovnat, použili jsme stejné datasety. Stejně jako Petr Kouba jsme tanečníky reprezentovali jako skeletony. Nicméně jsme pro jejich extrakci nahradili OpenPose za HRNet pro dosažení větší přesnosti skeletonu a MS-G3D jsme zaměnili za PoseC3D pro přesnější klasifikaci tanečních žánrů. Přesnost (Top-1) nově navrhované metody dosahuje na 10-Let's Dance datasetu 77.4\%, což je přibližně o 22\% více než metoda navrhnutá v práci Petra Kouby, ta dosahuje 55.5\%. Dále jsme metodu otestovali na datasetu Dance Tutorials Dataset, kde jsme dosáhli přesnosti 74.5\%, což je asi o 10\% více (64.8\%). We propose improvements of the recent work of Petr Kouba, concerning ballroom dance genre recognition from video. We focused on visual data only and for comparability we use the very same datasets. Similarly to Petr Kouba we use a skeleton representation of the dancers. However, we replaced OpenPose with HRNet for pose estimation to achieve better precision and MS-G3D with PoseC3D for more accurate classification of the dance genres. The Top-1 accuracy of our newly proposed method evaluated on the 10-Let's Dance dataset is 77.4\%, which is approximately 22\% higher than the Top-1 accuracy of the method proposed by Petr Kouba (55.5\%) and also on the Dance Tutorials Dataset achieving the Top-1 accuracy 74.5\%, which is roughly 10\% higher (64.8\%).
Collections
- Bakalářské práce - 13133 [706]