Identifikace cyklistických segmentů v GPS trajektoriích
Identification of Cycling Segments in Raw GPS Trajectories
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Milec David
Vedoucí práce
Žilecký Pavol
Oponent práce
Černoch Radomír
Studijní obor
Informatika a počítačové vědyStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra kybernetikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Pokrok v technologii umožnil vytváření velkého množství prostorových trajektorií, které obsahují mnoho informací o pohybu. Ve své bakalářské práci navrhuji metodu, která klasifikuje uživatelův pohyb do dvou modů s použitím GPS trajektorií. Soustředil jsem se na rozlišení mezi trajektoriemi nahranými na kole a nahranými jinde než na kole a definoval jsem problém jako classifikaci cyklistických trajektorií. Dále práce mapuje aktuální situaci v oboru data miningu s důrazem na klasifikační problémy. Použil jsem segmentaci na základě stay pointů pro rozdělení trajektorií na jednotlivé způsoby dopravy. Pro klasifikaci jsem použil klasifikátory Náhodný les, SVM a Neuronovou síť. Z těchto klasifikátorů měl nejlepší výsledky Náhodný les pro ručně segmentovaná data dosahující přesnosti 90,5 \%, ale jeho výkon byl horší pro data segmentovaná mojí segmentací. Na techto datech měl nejlepší výsledek SVM s přesností 75,9 \%. Abych otestoval škálovatelnost metody, otestoval jsem jí na datasetu cyklistických trajektorií bez označení, kde SVM měl nejlepší výsledek. Porovnal jsem metodu s ostatními metodami a zjistil, že některé mají vyšší přesnost než mnou použitá metoda. Já jsem ale otestoval různé typy filtrů a ukázal, jak se liší kvalita segmentace na základě různých prahů, což je něco, co jsem v žádném jiném článku nenašel. Recent advances in technology have generated extensive amount of spatial trajectories which contain a lot of information about movement. In my bachelor thesis I propose a method for classifying user's movement into two modes using GPS trajectory data. I focused on distinguishing between trajectories recorded while riding a bicycle and trajectories recorded while not riding a bicycle. I define this problem as a trajectory bicycle classification. My thesis also maps the present knowledge in data mining field focused on trajectory classification problem. Accordingly to state of the art I used methods as stay point segmentation for partitioning of a trajectory into single modal segments. For classification I used Random forest, SVM and Neural network models. From these methods Random forest shows the best results with accuracy of 90,5\% when testing on perfectly segmented data. However, it was outperformed by SVM on data segmented with method I used where SVM had the best result with accuracy of 75,9\%. To test the scalability of used method I perform evaluation on unlabeled dataset of bike rides, where SVM model performed the best. I also compared method I used with other methods and they perform better. However, I tested different filters and their combinations. I also evaluated segmentation performance based on different thresholds which is something not mentioned in available literary sources.
Kolekce
- Bakalářské práce - 13133 [787]