Zobrazit minimální záznam

Towards a dataset for estimation of keyboard fingerings



dc.contributor.advisorPecina Pavel
dc.contributor.authorFilip Danielsson
dc.date.accessioned2024-06-18T14:35:58Z
dc.date.available2024-06-18T14:35:58Z
dc.date.issued2024-06-13
dc.identifierKOS-1201011353605
dc.identifier.urihttp://hdl.handle.net/10467/115598
dc.description.abstractV této práci byl vyvinut postup, který kombinuje detekci klaviatury, segmentaci kláves, klavírní transkripci a odhad pozice rukou za účelem odhadu prstokladu z klavírních videí nahrávaných shora. Byl natrénován model pro lokalizaci klaviatury, následovaný algoritmem pro segmentaci a označování kláves. Lokalizace a segmentace klaviatury spolu s dělením videí na sekce byly testovány na 100 nejnovějších videích z pěti vybraných YouTube kanálů. Dále byl analyzován obsah těchto videí z hlediska datových bodů relevantních pro hru na klavír. Prstoklad byl odhadnut pomocí metriky vzdálenosti mezi rukama a hranicemi kláves, čímž bylo dosaženo přesnosti až 82 %. Využití znalostí o pozicích rukou také vedlo ke zlepšení F1 skóre klavírní transkripce o až 6,6 %. Výše zmíněné výsledky byly odvozeny z videa se 1227 notami s referenčním MIDI a ručně označenými prstoklady.cze
dc.description.abstractIn this work, a system was developed that combines keyboard detection, key segmentation, piano transcription, and hand-tracking into a pipeline for general piano performance videos recorded from an overhead perspective. A model was trained for localizing keyboards, and the background of the keyboard scenes was estimated, followed by a procedure for segmenting and labeling the keys. Keyboard detection, segmentation, and video sectioning were tested on the 100 latest videos from 5 prospective YouTube channels. Furthermore, the content of these videos was analyzed for data points relevant to pianist movements. Keyboard fingerings were predicted using a distance metric between the hands and key bounds, achieving an 82% accuracy. Utilizing the knowledge of hand positions also demonstrated up to a 6.6% improvement in piano transcription F1 score. An evaluation video containing 1227 notes with manually labeled fingerings and ground truth midi was created to derive the aforementioned fingering and transcription results.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectklavírní prstokladcze
dc.subjectdatová sadacze
dc.subjectkorekce datcze
dc.subjectklavírní transkripcecze
dc.subjectodhad pozice rukoucze
dc.subjectpiano fingeringeng
dc.subjectdataseteng
dc.subjectdata correctioneng
dc.subjectpiano transcriptioneng
dc.subjecthand trackingeng
dc.titleVytváření datové sady pro odhad prstokladucze
dc.titleTowards a dataset for estimation of keyboard fingeringseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeKlouda Karel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatika, platnost do 2024cze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam