Adaptace ASR systému Open AI pro zlepšení analýzy dysartrických promluv
Adaptation of ASR systém provided by Open AI to improve analysis of dysarthric speech
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Monika Weisheitlová
Vedoucí práce
Novotný Michal
Oponent práce
Sieger Tomáš
Studijní program
Lékařská elektronika a bioinformatikaInstituce přidělující hodnost
katedra teorie obvodůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Synukleinopatie, mezi něž patří Parkinsonova nemoc, demence s Lewyho tělísky a mnohočetná systémová atrofie, představují skupinu neurodegenerativních onemocnění, která často vedou k poruchám řeči. Tato bakalářská práce se zaměřuje na využití modelu automatického rozpoznávání řeči Whisper k transkripci promluv pacientů se synukleinopatiemi. Cílem je adaptovat model na patologickou řeč, která se v důsledku dysartrie liší od běžné mluvené řeči, a ověřit jeho použitelnost v klinickém výzkumu. Teoretická část práce shrnuje patofyziologii synukleinopatií a charakteristiku poruch řeči, které tyto nemoci způsobují. Praktická část se zabývá tvorbou datasetu z nahrávek spontánní řeči u 86 pacientů s lehkým a středním stupněm dysartrie, jeho využitím při adaptaci systému pro rozpoznávání řeči Whisper a vyhodnocením přesnosti adaptace. U řeči se středně těžkou dysartrií došlo po adaptaci ke zlepšení přesnosti přepisů o 29 %, u lehké dysartrie pak o 10 %. Práce ukazuje, že i při malém množství trénovacích dat lze dosáhnout výrazného zlepšení a zdůrazňuje potenciál automatické transkripce jako podpůrného nástroje pro klinickou diagnostiku i výzkum řečových poruch. Synucleinopathies, including Parkinsons disease, dementia with Lewy bodies, and multiple system atrophy, represent a group of neurodegenerative disorders that often lead to speech impairments. This bachelors thesis focuses on the use of the automatic speech recognition model Whisper to transcribe speech from patients with synucleinopathies. The aim is to adapt the model to pathological speech, which differs from typical spoken language due to dysarthria, and to evaluate its usability in clinical research. The theoretical part of the thesis provides an overview of the pathophysiology of synucleinopathies and the characteristics of the speech disorders they cause. The practical part deals with the creation of a dataset from recordings of spontaneous speech in 86 patients with mild to moderate dysarthria, its use in adapting the Whisper speech recognition system, and the evaluation of transcription accuracy. In speech with moderate dysarthria, adaptation led to a 29 % improvement in transcription accuracy; in mild dysarthria, the improvement was 10 %. The thesis demonstrates that even with a limited amount of training data, significant improvements can be achieved, and it highlights the potential of automatic transcription as a supportive tool for clinical diagnosis and speech disorder research.
Kolekce
- Bakalářské práce - 13131 [156]