Dance Genre Recognition from a Video of a Dancing Pair
Rozpoznávání tanečního žánru z videozáznamu páru
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Navrhujeme vylepšení nedávné práce Petra Kouby, která se týká rozpoznávání společenských tanců z videa. Soustředili jsme se výhrádně na vizuální data, a abychom mohli naše výsledky porovnat, použili jsme stejné datasety. Stejně jako Petr Kouba jsme tanečníky reprezentovali jako skeletony. Nicméně jsme pro jejich extrakci nahradili OpenPose za HRNet pro dosažení větší přesnosti skeletonu a MS-G3D jsme zaměnili za PoseC3D pro přesnější klasifikaci tanečních žánrů. Přesnost (Top-1) nově navrhované metody dosahuje na 10-Let's Dance datasetu 77.4\%, což je přibližně o 22\% více než metoda navrhnutá v práci Petra Kouby, ta dosahuje 55.5\%. Dále jsme metodu otestovali na datasetu Dance Tutorials Dataset, kde jsme dosáhli přesnosti 74.5\%, což je asi o 10\% více (64.8\%).
We propose improvements of the recent work of Petr Kouba, concerning ballroom dance genre recognition from video. We focused on visual data only and for comparability we use the very same datasets. Similarly to Petr Kouba we use a skeleton representation of the dancers. However, we replaced OpenPose with HRNet for pose estimation to achieve better precision and MS-G3D with PoseC3D for more accurate classification of the dance genres. The Top-1 accuracy of our newly proposed method evaluated on the 10-Let's Dance dataset is 77.4\%, which is approximately 22\% higher than the Top-1 accuracy of the method proposed by Petr Kouba (55.5\%) and also on the Dance Tutorials Dataset achieving the Top-1 accuracy 74.5\%, which is roughly 10\% higher (64.8\%).
We propose improvements of the recent work of Petr Kouba, concerning ballroom dance genre recognition from video. We focused on visual data only and for comparability we use the very same datasets. Similarly to Petr Kouba we use a skeleton representation of the dancers. However, we replaced OpenPose with HRNet for pose estimation to achieve better precision and MS-G3D with PoseC3D for more accurate classification of the dance genres. The Top-1 accuracy of our newly proposed method evaluated on the 10-Let's Dance dataset is 77.4\%, which is approximately 22\% higher than the Top-1 accuracy of the method proposed by Petr Kouba (55.5\%) and also on the Dance Tutorials Dataset achieving the Top-1 accuracy 74.5\%, which is roughly 10\% higher (64.8\%).
Description
Keywords
Citation
Underlying research data set URL
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.