Multi-instrument Music Transcription
Multi-instrument Music Transcription
Type of document
diplomová prácemaster thesis
Author
Yevhen Kuzmovych
Supervisor
Šmíd Marek
Opponent
Kordík Pavel
Field of study
Znalostní inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra aplikované matematikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Přepis hudby hraje důležitou roli v oblasti získávání hudebních informací, a je to často složitý úkol i pro lidského posluchače. Automatizace tohoto přepisu se těší velkému zájmu z řad studentů hudby, kteří jej mohou využít pro nácvik rozpoznávání not a učení nových skladeb. Také hudební producenti a DJ, kteří by mohli využít funkce detekce stupnice a oddělení zdrojových nástrojů, by z něj mohli těžit. Podobně streamingové platformy ho mohou používat pro své doporučovací systémy, atp. Tato práce zkoumá nejmodernější řešení, která kombinují analýzu signálů s přístupy strojového učení s učitelem pro uvedené problémy. Navrhuje implementaci, která je využita k provádění úlohy transkripce hudby s více nástroji, která má na vstupu surový zvukový soubor a produkuje sadu notových listů pro každý použitý nástroj na výstupu. Řešení je implementováno v programovacím jazyce Python jako modul a současně jako aplikace s rozhraním pro příkazovou řádku. Implementace je rozdělena do logických modulů zodpovědných za odhad odpovídajících částí výstupní partitury, jmenovitě oddělení zdrojů, detekce výšek a událostí, odhad tempa, stupnice a taktového předznamenání. Takové oddělení umožňuje jednoduché rozšiřování a testování. Přesnost každého modulu je vyhodnocená na příslušných datových sadách. Music transcription is important though complex, often even for a human listener, task in the field of music information retrieval. Automation of such task is in a big demand among musical students, who can use it for practicing of note recognition and learning of the new pieces; music producers and DJs, who could utilize its key detection and source instrument separation functionality; streaming platforms that may use it for their recommendation systems; etc. This thesis explores state-of-the-art solutions that combine signal analysis and supervised machine learning approaches for the mentioned problems. It proposes implementation that utilizes them to perform a multiple-instrument music transcription task having a raw audio file on the input and producing a set of sheet music scores for each played instrument on the output. The solution is implemented in the Python programming language as a module as well as a command-line interface application. The implementation is separated into logical modules responsible for estimation of the corresponding parts of the output score, namely source separation, pitch and event detection, tempo, key and time signature estimation. Such separation allows for simple expansion and testing. The performance of each module is evaluated on appropriate datasets.
Collections
- Diplomové práce - 18105 [195]