Zobrazit minimální záznam

Digital signal preprocessing for content recognition improvement



dc.contributor.advisorHolub Jan
dc.contributor.authorAytaj Sabitova
dc.date.accessioned2024-06-18T14:26:03Z
dc.date.available2024-06-18T14:26:03Z
dc.date.issued2024-06-06
dc.identifierKOS-1244075621405
dc.identifier.urihttp://hdl.handle.net/10467/115337
dc.description.abstractMluvení je hlavní způsob, jak lidé komunikují mezi sebou, bez kterého si téměř neumíme představit své životy. Již více jak století je věnováno mnoho pozornosti technologiím pro záznam a zpracování hlasu. Automatické rozpoznávání řeči (ASR) je jedním z důležitých prvků interakce člověka a stroje. Výzkum v této oblasti technologie je v současné době velmi aktuální. V posledních desetiletích ASR zaznamenalo velké zlepšení, které přineslo významné pokroky v několika klíčových oblastech. Díky těmto vylepšením se ASR stal nejen součástí našich každodenních životů, ale také důležitým systémem v mnoha oblastech, jako jsou vojenské komunikace, řízení leteckého provozu, veřejné bezpečnostní sítě a systémy pro nouzovou reakci. Přesto je ASR stále nedokonalé v realistických situacích, kdy vykazuje pokles výkonu v některých aspektech. Je prokázáno, že tyto systémy vykazují různé výkonnosti mezi pohlavími a také některé jazyky jsou méně příznivé pro ASR ve srovnání s jinými. V této práci se zaměřujeme na zvýšení úspěšnosti rozpoznávání obsahu radiového kanálu. Cílem je navrhnout a charakterizovat postupy, které dosahují nejlepších výsledků. Náš výzkum lze rozdělit do těchto hlavních oblastí: nejprve poskytujeme přehled nejnovějších metod v dané oblasti; poté představujeme náš přístup a simulovanou metodu, kterou plánujeme použít; nakonec představujeme a porovnáváme výsledky k diskusi. Celkově tato práce poskytuje ucelený přehled hlasových číslicově zpracovaných signálů a systémů automatického rozpoznávání řeči (ASR), a nabízí cenné poznatky pro optimalizaci těchto systémů.cze
dc.description.abstractSpeech is the main way people communicate with each other, and we cannot even imagine our lives without it. Since a century ago, there have been lots of works dedicated to speech technologies. Automatic Speech Recognition (ASR), is one of the important bridges between human-machine interactions. Working with this technology is always considered important. In the last decades, ASR has seen enormous improvements, making significant improvements in several key areas. Thanks to these improvements, ASR has become not only a part of our daily lives but also an important system in diverse areas such as military communications, air traffic control, public safety networks, and emergency response systems. Despite these improvements, ASR still lacks realistic situations and shows performance drops in some aspects. There is evidence that these systems show different performances between genders, and some languages are less favorable for ASR compared to others. In this thesis, we focus on increasing the success rate of speech radio channel content recognition. We aim to design and characterize procedures that achieve the best results. Our research can be divided into main areas: first, we provide an overview of state-of-the-art methods on the topic; then, we present our approach and simulated method that we intend to use; finally, we present and compare results for discussion. In conclusion, this research provides a comprehensive understanding of speech, digital signal processing, and Automatic Speech Recognition (ASR) systems, offering valuable insights into the optimization of these systems.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectSpeechcze
dc.subjectAutomatic Speech Recognitioncze
dc.subjectDigital Signal Processingcze
dc.subjectWord Error Ratecze
dc.subjectWERcze
dc.subjectAudio and speech processingcze
dc.subjectSpeech-to-textcze
dc.subjectSpeecheng
dc.subjectAutomatic Speech Recognitioneng
dc.subjectDigital Signal Processingeng
dc.subjectWord Error Rateeng
dc.subjectWEReng
dc.subjectAudio and speech processingeng
dc.subjectSpeech-to-texteng
dc.titlePředzpracování digitálního signálu pro zlepšení rozpoznávání obsahucze
dc.titleDigital signal preprocessing for content recognition improvementeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeNovák Jiří
theses.degree.grantorkatedra měřenícze
theses.degree.programmeCybernetics and Roboticscze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam