Předzpracování digitálního signálu pro zlepšení rozpoznávání obsahu
Digital signal preprocessing for content recognition improvement
dc.contributor.advisor | Holub Jan | |
dc.contributor.author | Aytaj Sabitova | |
dc.date.accessioned | 2024-06-18T14:26:03Z | |
dc.date.available | 2024-06-18T14:26:03Z | |
dc.date.issued | 2024-06-06 | |
dc.identifier | KOS-1244075621405 | |
dc.identifier.uri | http://hdl.handle.net/10467/115337 | |
dc.description.abstract | Mluvení je hlavní způsob, jak lidé komunikují mezi sebou, bez kterého si téměř neumíme představit své životy. Již více jak století je věnováno mnoho pozornosti technologiím pro záznam a zpracování hlasu. Automatické rozpoznávání řeči (ASR) je jedním z důležitých prvků interakce člověka a stroje. Výzkum v této oblasti technologie je v současné době velmi aktuální. V posledních desetiletích ASR zaznamenalo velké zlepšení, které přineslo významné pokroky v několika klíčových oblastech. Díky těmto vylepšením se ASR stal nejen součástí našich každodenních životů, ale také důležitým systémem v mnoha oblastech, jako jsou vojenské komunikace, řízení leteckého provozu, veřejné bezpečnostní sítě a systémy pro nouzovou reakci. Přesto je ASR stále nedokonalé v realistických situacích, kdy vykazuje pokles výkonu v některých aspektech. Je prokázáno, že tyto systémy vykazují různé výkonnosti mezi pohlavími a také některé jazyky jsou méně příznivé pro ASR ve srovnání s jinými. V této práci se zaměřujeme na zvýšení úspěšnosti rozpoznávání obsahu radiového kanálu. Cílem je navrhnout a charakterizovat postupy, které dosahují nejlepších výsledků. Náš výzkum lze rozdělit do těchto hlavních oblastí: nejprve poskytujeme přehled nejnovějších metod v dané oblasti; poté představujeme náš přístup a simulovanou metodu, kterou plánujeme použít; nakonec představujeme a porovnáváme výsledky k diskusi. Celkově tato práce poskytuje ucelený přehled hlasových číslicově zpracovaných signálů a systémů automatického rozpoznávání řeči (ASR), a nabízí cenné poznatky pro optimalizaci těchto systémů. | cze |
dc.description.abstract | Speech is the main way people communicate with each other, and we cannot even imagine our lives without it. Since a century ago, there have been lots of works dedicated to speech technologies. Automatic Speech Recognition (ASR), is one of the important bridges between human-machine interactions. Working with this technology is always considered important. In the last decades, ASR has seen enormous improvements, making significant improvements in several key areas. Thanks to these improvements, ASR has become not only a part of our daily lives but also an important system in diverse areas such as military communications, air traffic control, public safety networks, and emergency response systems. Despite these improvements, ASR still lacks realistic situations and shows performance drops in some aspects. There is evidence that these systems show different performances between genders, and some languages are less favorable for ASR compared to others. In this thesis, we focus on increasing the success rate of speech radio channel content recognition. We aim to design and characterize procedures that achieve the best results. Our research can be divided into main areas: first, we provide an overview of state-of-the-art methods on the topic; then, we present our approach and simulated method that we intend to use; finally, we present and compare results for discussion. In conclusion, this research provides a comprehensive understanding of speech, digital signal processing, and Automatic Speech Recognition (ASR) systems, offering valuable insights into the optimization of these systems. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Speech | cze |
dc.subject | Automatic Speech Recognition | cze |
dc.subject | Digital Signal Processing | cze |
dc.subject | Word Error Rate | cze |
dc.subject | WER | cze |
dc.subject | Audio and speech processing | cze |
dc.subject | Speech-to-text | cze |
dc.subject | Speech | eng |
dc.subject | Automatic Speech Recognition | eng |
dc.subject | Digital Signal Processing | eng |
dc.subject | Word Error Rate | eng |
dc.subject | WER | eng |
dc.subject | Audio and speech processing | eng |
dc.subject | Speech-to-text | eng |
dc.title | Předzpracování digitálního signálu pro zlepšení rozpoznávání obsahu | cze |
dc.title | Digital signal preprocessing for content recognition improvement | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Novák Jiří | |
theses.degree.grantor | katedra měření | cze |
theses.degree.programme | Cybernetics and Robotics | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13138 [374]