Identifikace obsahu archivních zvukových záznamů
Archive Audio Record Content Identification
Type of document
bakalářská prácebachelor thesis
Author
Koshkina Ekaterina
Supervisor
Rund František
Opponent
Vencovský Václav
Field of study
Multimediální technikaStudy program
Komunikace, multimédia a elektronikaInstitutions assigning rank
katedra radioelektronikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Show full item recordAbstract
Tato práce se zabývá problematikou identifikace (rozpoznávaní) obsahu archivních zvukových záznamů. Cílem je seznámení s danou problematikou a realizace vybraného algoritmu identifikace v programovém prostředí MATLAB. Hlavními kroky v realizovaném algoritmu jsou segmentace, parametrizace a klasifikace. Implementovaný algoritmus využívá klasifikátoru k-Nearest Neighbors (KNN). Výstupem této práce je systém, který je schopný identifikovat jednotlivé typy zvukových záznamů (řeč, hudba, hluk, ticho) ve vstupní archivní nahrávce. Systém odhaduje pravděpodobnost výskytu jednotlivých typů zvuku v závislosti na čase. Funkce algoritmu je ověřena na ukázkách nahrávek z archivních filmů. This bachelor thesis introduces the problem of content-based identification (recognition) of archive audio records. The goal of this thesis is to familiarize with the problem and to implement the selected method of the identification in MATLAB environment. The main steps of the algorithm include segmentation, feature extraction and classification. The algorithm uses k-Nearest Neighbors (KNN) classifier. The outcome of this work is represented by a system which is capable of identifying different types of audio records (speech, music, noise, silence) in the input archive record. The system estimates the time relevant probability of occurrence of mentioned types of audio records. Functionality of the algorithm is verified with records from archive movies.
Collections
- Bakalářské práce - 13137 [297]