Identifikace obsahu archivních zvukových záznamů
Archive Audio Record Content Identification
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Koshkina Ekaterina
Vedoucí práce
Rund František
Oponent práce
Vencovský Václav
Studijní obor
Multimediální technikaStudijní program
Komunikace, multimédia a elektronikaInstituce přidělující hodnost
katedra radioelektronikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá problematikou identifikace (rozpoznávaní) obsahu archivních zvukových záznamů. Cílem je seznámení s danou problematikou a realizace vybraného algoritmu identifikace v programovém prostředí MATLAB. Hlavními kroky v realizovaném algoritmu jsou segmentace, parametrizace a klasifikace. Implementovaný algoritmus využívá klasifikátoru k-Nearest Neighbors (KNN). Výstupem této práce je systém, který je schopný identifikovat jednotlivé typy zvukových záznamů (řeč, hudba, hluk, ticho) ve vstupní archivní nahrávce. Systém odhaduje pravděpodobnost výskytu jednotlivých typů zvuku v závislosti na čase. Funkce algoritmu je ověřena na ukázkách nahrávek z archivních filmů. This bachelor thesis introduces the problem of content-based identification (recognition) of archive audio records. The goal of this thesis is to familiarize with the problem and to implement the selected method of the identification in MATLAB environment. The main steps of the algorithm include segmentation, feature extraction and classification. The algorithm uses k-Nearest Neighbors (KNN) classifier. The outcome of this work is represented by a system which is capable of identifying different types of audio records (speech, music, noise, silence) in the input archive record. The system estimates the time relevant probability of occurrence of mentioned types of audio records. Functionality of the algorithm is verified with records from archive movies.
Kolekce
- Bakalářské práce - 13137 [297]