Využití data miningu pro analýzu fyzické aktivity člověka pomocí dat generovaných akcelerometrem
Use of data mining for analysis of human physical activity by accelerometer generated data
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Tomáš Nagy
Vedoucí práce
Náplava Pavel
Oponent práce
Hrabák Marek
Studijní program
Softwarové inženýrství a technologieInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Nárast výpočtovej a snímacej sily nám umožňuje implementovať rôzne aplikácie založené na schopnosti zhromažďovať a analyzovať dáta, aby sa náš život stal ľahším a inteligentnejším. Pre tento účel slúžia aplikácie na báze rozpoznávania ľudskej aktivity (HAR). Aplikácia založená HAR umožňuje rozpoznať konkrétnu vykonanú činnosť uživateľom. Vybudovanie systému HAR je komplexná úloha. Chyba pri budovaní jeho základocv, ako napríklad použitie nespoľahlivého zdroja dát alebo použitie nesprávnej techniky, môže viesť k nepresnosti klasifikácie vykonaných činností. V tejto štúdii sme skúmali päť algoritmov supervizovaného strojového učenia, aby sme potvrdili, či môžu s požadovanou presnosťou predpovedať množinu preddefinovaných fyzických aktivít na vopred vybratom predspracovanom súbore dát. Na základe toho bola stanovená hypotéza. Hodnotili sme výkon implementovaných algoritmov. Výsledkom bolo, že klasifikátor podporných vektorov vykonáva najpresnejšie výsledky klasifikácie a dosahuje 91,24 % úspešnosti. Náhodný les, multinomická logistická regresia a algoritmus k-najbližších susedov dosiahli 90 % presnosť klasifikácie. Najslabšie výsledky boli získané pomocou klasifikátora rozhodovacích stromov s presnosťou 83 %. Hypotéza bola potvrdená. The rise of computing and sensing power has allowed us to implement various applications based on the ability to gather and analyse data in order to make our lives easier and smarter. For instance, apply- ing Human Activity Recognition (HAR) serves such a purpose. An application based on HAR enables the recognition of a particular activity performed by a user. Building a HAR system is a complex task. A mistake in its fundamentals, like using an unreliable data source or utilising an incorrect technique, can result in inaccuracies within the classification of the performed activities. In this study, we examined five supervised machine learning algorithms to confirm whether they can predict the set of predefined physical activities with a desirable accuracy on a chosen pre-processed dataset. Based on that, a hypothesis was set. We evaluated the performance of the implemented algorithms. The result was that the Support Vector Classifier renders the most accurate classification results, reaching 91.24 %. Random Forest Classifier, Multinomial Logistic Regression, K-nearest Neighbors provided results with approximately 90 % of classification accuracy. The weakest results were obtained by Decision Tree Classifier. The hypothesis was proven.
Kolekce
- Bakalářské práce - 13136 [1124]