Recognition of Dance Genres from Video
Rozpoznávání tance z videa
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date of defense
Abstract
Předkládáme metodu rozpoznávání společenských tanců z videa. Metoda je založena na využití nástroje OpenPose, který odhaduje postoj snímaných tanečníků v jednotlivých snímcích videa. Následně klasifikujeme posloupnosti odhadnutých postojů za pomoci grafové konvoluční neuronové sítě MS-G3D. Za účelem vývoje této metody jsme sestavili tři vhodné sady videí, které nabízíme veřejně k dispozici. Na sadě videí, zobrazujících jasně jeden taneční pár a nenarušených přitomností jiných osob, dosahuje navrhovaná metoda přesnosti klasifikace 72.2 % (Top-1). Přesnost klasifikace se zvyšuje na 83.3 % (Top-1) pokud metodu spojíme s existující metodou klasifikující tanec na základě audia (sama o sobě dosahuje tato audio-klasifikace na zmiňované datové sadě přesnosti 66.7 % (Top-1)).
We propose a method for recognition of ballroom dance genres from video. The method is based on processing of videos by a human pose estimation framework OpenPose and a subsequent classification of the sequences of the estimated poses using a Graph Convolutional Neural Network called MS-G3D. For the purposes of the method development we collected three suitable video datasets which we make publicly available. On a set of videos containing a clearly visible dance couple, undisturbed by presence of other people, the method achieves Top-1 accuracy 72.2 %. The classification accuracy improves to 83.3 % when the method is combined with an existing audio-based dance classifier (which on its own reaches an accuracy of 66.7 % on the dataset).
We propose a method for recognition of ballroom dance genres from video. The method is based on processing of videos by a human pose estimation framework OpenPose and a subsequent classification of the sequences of the estimated poses using a Graph Convolutional Neural Network called MS-G3D. For the purposes of the method development we collected three suitable video datasets which we make publicly available. On a set of videos containing a clearly visible dance couple, undisturbed by presence of other people, the method achieves Top-1 accuracy 72.2 %. The classification accuracy improves to 83.3 % when the method is combined with an existing audio-based dance classifier (which on its own reaches an accuracy of 66.7 % on the dataset).
Description
Keywords
Citation
Permanent link
Rights/License
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.