Dance Genre Recognition from a Video of a Dancing Pair
Rozpoznávání tanečního žánru z videozáznamu páru
Date
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Abstract
Navrhujeme vylepšení nedávné práce Petra Kouby, která se týká rozpoznávání společenských tanců z videa. Soustředili jsme se výhrádně na vizuální data, a abychom mohli naše výsledky porovnat, použili jsme stejné datasety. Stejně jako Petr Kouba jsme tanečníky reprezentovali jako skeletony. Nicméně jsme pro jejich extrakci nahradili OpenPose za HRNet pro dosažení větší přesnosti skeletonu a MS-G3D jsme zaměnili za PoseC3D pro přesnější klasifikaci tanečních žánrů. Přesnost (Top-1) nově navrhované metody dosahuje na 10-Let's Dance datasetu 77.4\%, což je přibližně o 22\% více než metoda navrhnutá v práci Petra Kouby, ta dosahuje 55.5\%. Dále jsme metodu otestovali na datasetu Dance Tutorials Dataset, kde jsme dosáhli přesnosti 74.5\%, což je asi o 10\% více (64.8\%).
We propose improvements of the recent work of Petr Kouba, concerning ballroom dance genre recognition from video. We focused on visual data only and for comparability we use the very same datasets. Similarly to Petr Kouba we use a skeleton representation of the dancers. However, we replaced OpenPose with HRNet for pose estimation to achieve better precision and MS-G3D with PoseC3D for more accurate classification of the dance genres. The Top-1 accuracy of our newly proposed method evaluated on the 10-Let's Dance dataset is 77.4\%, which is approximately 22\% higher than the Top-1 accuracy of the method proposed by Petr Kouba (55.5\%) and also on the Dance Tutorials Dataset achieving the Top-1 accuracy 74.5\%, which is roughly 10\% higher (64.8\%).
We propose improvements of the recent work of Petr Kouba, concerning ballroom dance genre recognition from video. We focused on visual data only and for comparability we use the very same datasets. Similarly to Petr Kouba we use a skeleton representation of the dancers. However, we replaced OpenPose with HRNet for pose estimation to achieve better precision and MS-G3D with PoseC3D for more accurate classification of the dance genres. The Top-1 accuracy of our newly proposed method evaluated on the 10-Let's Dance dataset is 77.4\%, which is approximately 22\% higher than the Top-1 accuracy of the method proposed by Petr Kouba (55.5\%) and also on the Dance Tutorials Dataset achieving the Top-1 accuracy 74.5\%, which is roughly 10\% higher (64.8\%).