ČVUT DSpace
  • Search DSpace
  • Čeština
  • Login
  • Čeština
  • Čeština
View Item 
  •   ČVUT DSpace
  • Czech Technical University in Prague
  • Faculty of Electrical Engineering
  • Department of Computer Science and Engineering
  • Master Theses - 13136
  • View Item
  • Czech Technical University in Prague
  • Faculty of Electrical Engineering
  • Department of Computer Science and Engineering
  • Master Theses - 13136
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Vizualizace a zpracování dat chronických pacientů

Visualization and analysis of patients digital phenotypes

Type of document
diplomová práce
master thesis
Author
David Kolečkář
Supervisor
Novák Daniel
Opponent
Huptych Michal
Field of study
Bioinformatika
Study program
Otevřená informatika
Institutions assigning rank
katedra počítačů



Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item record
Abstract
Tato diplomová práce si klade za cíl analyzovat data pacientů s chronickými onemocněními a identifikovat podskupiny jejich populace, pro které lze poskytnout více personalizovanou léčbu pomocí nejmodernějších metod shlukování a hlubokého učení. Zaměřuje se dále na pacienty s chronickou závislostí na tabáku a poskytuje přehled nejnovějších přístupů v oblasti mobilního zdravotnictví (m-health) a hlubokého fenotypování. Pro tyto účely byl vytvořen vhodný datový soubor z databáze mobilní aplikace pro odvykání kouření s reálnými daty pacientů, o velikosti přibližně 5000 pacientů a 20 měřených, převážně sociodemografických, charakteristik. Dále jsou v rámci studie řešeny problémy spojené s prací s daty obsahujícími smíšené - numerické a kategoriální - proměnné jsou řešeny. Následně je představena technika pro získání vhodných reprezentací speciálního případu nominálních proměnných, pomocí trénování neuronových sítí. Jsou diskutovány nejnovější metody shlukování a redukce dimenzionality jako jsou Autoenkodéry a Variační Autoenkodéry. Poté je provedena explorativní analýza vytvořených datových sad, jejímž výsledkem jsou cenné popisné a grafické statistické informace o populaci závislých na nikotinu. Nakonec je populace rozdělena do shluků shlukovacími algoritmy, což umožňuje odhad digitálních fenotypů uvnitř jednotlivých shluků pacientů. V závislosti na různých hyperparametrech bylo identifikováno 7 až 8 dobře definovaných shluků, fenotypů, v populaci. Zjištěné digitální fenotypy umožňují budoucí zlepšení personalizované terapie a také poskytují hodnotnou zpětnou vazbu pro budoucí sběr dat pacientů skrz mobilní aplikaci.
 
This thesis aims at analyzing chronic patients data, trying to identify subgroups in the population for which a more personalized treatment can be provided, using state-of-the-art unsupervised clustering and deep learning methods. Focusing further on the patients with chronic tobacco addiction, overview of the latest m-health and deep phenotyping approaches is given. Suitable dataset is created from the database of smoking cessation smartphone application with real patients data, of cardinality of approximately 5000 patients with 20 measured, mainly sociodemographic, features. Issues emerged by working with dataset with mixed – numerical and categorical – variables are solved. It is done in rather innovative manner, proposing new technique of training Entity Embeddings for special case of nominal variables. Latest dimensionality reduction methods are discussed, namely the Autoencoders and Variational Autoencoders. Later the same is done for the clustering algorithms. Afterward, for the created datasets exploratory analysis is carried on, yielding valuable descriptive and graphical information about the patients population. Finally the patients are clustered, using algorithms. From the emerged patients clusters are estimated the digital phenotypes. Depending on the numerous hyperparameters 7 to 8 well defined clusters, phenotypes, were identified in the patients population. These results enable future personalized therapy improvements and provide valuable feedback for the patients data collection process.
 
URI
http://hdl.handle.net/10467/109199
View/Open
PLNY_TEXT (5.885Mb)
PRILOHA (17.04Mb)
POSUDEK (140.2Kb)
POSUDEK (4.017Mb)
Collections
  • Diplomové práce - 13136 [966]

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Useful links

CTU in PragueCentral library of CTUAbout CTU Digital LibraryResourcesStudy and library skillsResearch support

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

České vysoké učení technické v Praze copyright © 2016 

DSpace software copyright © 2002-2016  Duraspace

Contact Us | Send Feedback
Theme by 
@mire NV