Analýza kognitivních poruch z řeči u neurologických onemocnění
Analysis of cognitive speech and language disorders in neurological diseases
Typ dokumentu
disertační prácedoctoral thesis
Autor
Martin Šubert
Vedoucí práce
Rusz Jan
Oponent práce
Krack Paul
Studijní program
BioinženýrstvíInstituce přidělující hodnost
katedra teorie obvodůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Včasná identifikace neurodegenerativních onemocnění a efektivní sledování progrese choroby jsou klíčové pro rozvoj neuroprotektivních terapií. Onemocnění jako roztroušená skleróza (RS), Parkinsonova nemoc (PN) a související synukleinopatie často provází postupný kognitivní pokles. Řeč a jazyk, jakožto základní kognitivní funkce, jsou v těchto chorobách často narušeny, přičemž abnormality se objevují již v raných stádiích, což je činí perspektivními kandidáty na neinvazivní digitální biomarkery. Tato disertační práce představuje vývoj plně automatizovaného systému jakožto digitálních biomarkerů založených na analýze jazyka pro diagnostiku a sledování kognitivně-lingvistických poruch u neurodegenerativních onemocnění. Byl vyvinut vícekrokový proces zahrnující sběr řeči, automatickou transkripci a extrakci lingvistických parametrů pomocí metod zpracování přirozeného jazyka (NLP) a velkých jazykových modelů (LLM). Standardizované laboratorní testy zahrnující řečové úkoly (monolog a vyprávění příběhu) sloužily jako konceptuální rámec pro NLP analýzu. Následně byl aplikován inovativní přístup využívající záznamy reálných telefonních hovorů k hodnocení jazyka v přirozených podmínkách pomocí kontextuálních lingvistických parametrů odvozených z LLM analýzy. Analýza pomocí NLP, která pracovala na základě standardizovaných laboratorních řečových úloh, prokázala vysokou senzitivitu při detekci zdravých kontrol od osob s RS, PN, multisystémovou atrofií a izolovanou poruchou chování v REM spánku (iRBD), což je speciální případ prodromální synukleinopatie. Extrahované lingvistické parametry byly navíc senzitivní na účinky dlouhodobé dopaminergní terapie u PN a predikovaly fenokonverzi z iRBD na klinicky definované synukleinopatie, včetně PN a demence s Lewyho tělísky. Analýza pomocí LLM u nahrávek reálných telefonních hovorů prokázala vysoké využití při diagnostice onemocnění a umožnila longitudinální sledování progrese onemocnění v přirozených podmínkách. Významným výsledkem bylo také prokázání robustnosti systému vůči chybám v transkripci způsobeným neurodegenerativními poruchami řeči a jeho jazykově nezávislý design, což může napomáhat v široké klinické využitelnosti. Disertační práce obsahuje šest publikovaných studií, které společně posouvají vědecké a klinické poznání lingvistických biomarkerů u neurodegenerativních onemocnění. Navržený systém je škálovatelný, pasivní a ekonomicky efektivní, nabízí neinvazivní nástroj pro včasnou detekci, vzdálený populační screeningy a kontinuální sledování účinnosti léčby v klinických studiích. Tento výzkum podporuje integraci digitálních lingvistických biomarkerů do běžné neurologické praxe a vědeckého výzkumu. Early identification of neurodegenerative disorders and effective monitoring of disease progression are critical for advancing neuroprotective therapies. Conditions such as multiple sclerosis (MS), Parkinsons disease (PD), and related synucleinopathies often involve progressive cognitive decline. Speech and language, as fundamental cognitive functions, are frequently disrupted in these diseases, with abnormalities often emerging as some of the earliest signs, making them promising candidates for non-invasive digital biomarkers. This dissertation presents the development of a fully automated, language-based digital biomarker system for diagnosing and tracking cognitive-linguistic impairments in neurodegenerative diseases. A multi-step pipeline was developed, integrating speech collection, automatic transcription, and linguistic feature extraction using both natural language processing (NLP) and large language model (LLM) methods. Laboratory-based assessments involving standardized speech tasks (monologue and story-telling) served as a proof-of-concept framework for NLP-based analysis. Next, a novel approach using real-world phone call recordings enabled the evaluation of language in naturalistic settings via LLM-based contextual linguistic features. The NLP-based analysis of standardized laboratory speech tasks demonstrated high sensitivity in distinguishing healthy controls from individuals with MS, PD, multiple system atrophy, and isolated rapid eye movement sleep behavior disorder (iRBD), a special case of prodromal synucleinopathy. In addition, the extracted linguistic features proved responsive to the effects of long-term dopaminergic therapy in PD and were predictive of phenoconversion from iRBD to clinically defined synucleinopathies, including PD and dementia with Lewy bodies. Complementing these findings, the LLM-based analysis of spontaneous, real-world phone conversations showed strong diagnostic utility and enabled the longitudinal monitoring of disease progression in naturalistic settings. Importantly, the system demonstrated robustness to transcription errors caused by neurodegenerative speech impairments and maintained performance across languages due to its language-agnostic design, highlighting its broad clinical applicability. This dissertation comprises six published studies that collectively advance the scientific and clinical understanding of language biomarkers in neurodegeneration. The proposed system is scalable, passive, and cost-effective, offering a non-invasive tool for early detection, remote population screening, and continuous monitoring of treatment efficacy in clinical trials. This work supports the integration of digital language biomarkers into routine neurological care and research.
Zobrazit/ otevřít
Kolekce
- Disertační práce - 13000 [752]