Analýza a vizualizace uživatelských dat mobilní aplikace pro odvyknutí kouření
Smoking Cessation Programme App User Data Analysis and Visualisation
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Michal Šípek
Vedoucí práce
Prokop Jindřich
Oponent práce
Gabrhelík Roman
Studijní obor
Informatika a počítačové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Expanze na trhu chytrých telefonů umožňuje kuřákům začít odvykat kouření s pomocí jejich mobilních zařízení. Mobilní aplikace mohou uživateli pomoct projít celým procesem odvykání. Tato práce se zaměřuje na analýzu a vizualizaci uživatelských dat z jedné takové aplikace. Uživatelská data byla rozdělena na dvě hlavní skupiny - data jako jsou demografické údaje či postup aplikací, u kterých lze hodnoty automaticky interpretovat, a nestrukturovaná textová data. První skupina dat byla následně vizualizována pomocí vlastního rozšíření Django administrace, které umožňuje autorizovaným uživatelům filtrovat a dále zpracovávat uživatelská data a volit požadovaný typ grafu pro danou vizualizaci. Analýza nestrukturovaných textových dat se zaměřila na návrh klasifikátoru s pomocí algoritmu K-Nearest Neighbors, který by byl schopen přiřadit více označení k jednotlivým hlavním důvodům uživatelů pro odvykání. Pro tento účel byla definována sada 7 možných označení: peníze, zdraví, vztahy, těhotenství, osobní hodnoty a estetika. Klasifikátor dosáhl 84% přesnosti. Klasifikátor byl následně použit na množinu 1822 uživatelských odpovědí. Z klasifikace bylo odhadnuto, že 60,3 % uživatelů se rozhodlo skončit ze zdravotních důvodů, 37,5 % z finančních důvodů, 18,6 % kvůli jejich životním cílům a/nebo osobním hodnotám, 15,6 % kvůli rodině či přátelům, 10,3 % kvůli dopadu na jejich psychiku, 1,3 % kvůli těhotenství a 0,4 % z estetických důvodů. With the expansion of the smartphone market, smokers have the ability to enroll in a virtual smoking cessation programme on their phones. Such mobile applications can help users with the whole smoking cessation process. This thesis focuses on analyzing and visualizing user data from one such application. User data was split into two main groups - data such as demographics and application progress, for which the values can be automatically interpreted, and free text input. The first group was then visualized through a custom extension of Django's administration interface that gives authorized users the ability to filter and process user data, as well as select the desired chart type. Free text input analysis focused on designing a K-Nearest Neighbors classifier that would assign multiple labels to responses users entered as their main reasons for quitting. A set of 7 possible labels was defined: money, health, relationships, pregnancy, personal values, and aesthetics. The classifier was able to achieve 84% accuracy. Using this classifier on a dataset of 1822 user responses, it was estimated that 60.3% of users were quitting for health-related reasons, 37.5% for financial reasons, 18.6% because of their life goals and/or personal values, 15.6% because of their family/friends, 10.3% for their state of mind, 1.3% because of pregnancy, and 0.4% for aesthetic reasons.
Kolekce
- Bakalářské práce - 13133 [778]