Předzpracování digitálního signálu pro zlepšení rozpoznávání obsahu
Digital signal preprocessing for content recognition improvement
Typ dokumentu
diplomová prácemaster thesis
Autor
Aytaj Sabitova
Vedoucí práce
Holub Jan
Oponent práce
Novák Jiří
Studijní program
Cybernetics and RoboticsInstituce přidělující hodnost
katedra měřeníPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Mluvení je hlavní způsob, jak lidé komunikují mezi sebou, bez kterého si téměř neumíme představit své životy. Již více jak století je věnováno mnoho pozornosti technologiím pro záznam a zpracování hlasu. Automatické rozpoznávání řeči (ASR) je jedním z důležitých prvků interakce člověka a stroje. Výzkum v této oblasti technologie je v současné době velmi aktuální. V posledních desetiletích ASR zaznamenalo velké zlepšení, které přineslo významné pokroky v několika klíčových oblastech. Díky těmto vylepšením se ASR stal nejen součástí našich každodenních životů, ale také důležitým systémem v mnoha oblastech, jako jsou vojenské komunikace, řízení leteckého provozu, veřejné bezpečnostní sítě a systémy pro nouzovou reakci. Přesto je ASR stále nedokonalé v realistických situacích, kdy vykazuje pokles výkonu v některých aspektech. Je prokázáno, že tyto systémy vykazují různé výkonnosti mezi pohlavími a také některé jazyky jsou méně příznivé pro ASR ve srovnání s jinými. V této práci se zaměřujeme na zvýšení úspěšnosti rozpoznávání obsahu radiového kanálu. Cílem je navrhnout a charakterizovat postupy, které dosahují nejlepších výsledků. Náš výzkum lze rozdělit do těchto hlavních oblastí: nejprve poskytujeme přehled nejnovějších metod v dané oblasti; poté představujeme náš přístup a simulovanou metodu, kterou plánujeme použít; nakonec představujeme a porovnáváme výsledky k diskusi. Celkově tato práce poskytuje ucelený přehled hlasových číslicově zpracovaných signálů a systémů automatického rozpoznávání řeči (ASR), a nabízí cenné poznatky pro optimalizaci těchto systémů. Speech is the main way people communicate with each other, and we cannot even imagine our lives without it. Since a century ago, there have been lots of works dedicated to speech technologies. Automatic Speech Recognition (ASR), is one of the important bridges between human-machine interactions. Working with this technology is always considered important. In the last decades, ASR has seen enormous improvements, making significant improvements in several key areas. Thanks to these improvements, ASR has become not only a part of our daily lives but also an important system in diverse areas such as military communications, air traffic control, public safety networks, and emergency response systems. Despite these improvements, ASR still lacks realistic situations and shows performance drops in some aspects. There is evidence that these systems show different performances between genders, and some languages are less favorable for ASR compared to others. In this thesis, we focus on increasing the success rate of speech radio channel content recognition. We aim to design and characterize procedures that achieve the best results. Our research can be divided into main areas: first, we provide an overview of state-of-the-art methods on the topic; then, we present our approach and simulated method that we intend to use; finally, we present and compare results for discussion. In conclusion, this research provides a comprehensive understanding of speech, digital signal processing, and Automatic Speech Recognition (ASR) systems, offering valuable insights into the optimization of these systems.
Kolekce
- Diplomové práce - 13138 [374]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Design and Implementation of an End-to-End Speech Assistant
Autor: Felix Staudigl; Vedoucí práce: Schade Sascha; Oponent práce: Spilka Jiří
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2019-06-19)Efektivní komunikace mezi člověkem a strojem představuje důležitou oblast výzkumu. Nedávné pokroky v oblasti strojového učení, konkrétně v oblasti zpracování přirozeného jazyka, umožňují inteligentním robotům využít hlasové ... -
Rozpoznávání řeči při různé kvalitě vstupního signálu
Autor: Běhunek Martin; Vedoucí práce: Pollák Petr
(České vysoké učení technické v Praze. Vypočetní a informační centrum., 2011-10-14) -
CELP kodér pro řečový signál snímaný v hlučném prostředí
Autor: Hamšík Zdeněk; Vedoucí práce: Pollák Petr
(České vysoké učení technické v Praze. Vypočetní a informační centrum., 2011-10-14)