Daty podložené přidělování zakázek v taxi službách s autonomními řidiči
Data-driven job allocation in taxi services with autonomous drivers
Type of document
diplomová prácemaster thesis
Author
Zikeš Jan
Supervisor
Jakob Michal
Opponent
Černoch Radomír
Field of study
Umělá inteligenceStudy program
Otevřená informatikaInstitutions assigning rank
katedra počítačůDefended
2015-01-21Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Show full item recordAbstract
V této práci jsme nejdříve zformalizovali mechanismus propojující taxikáře a pasažéry, který je použit jako součást moderního systém pro rezervace vozidel taxi za pomoci mobilních aplikací. Jako klíčovou a kritickou část současného mechanismu jsme identifikovali problém, kterým řidičům mají být zasílány požadavky od pasažérů.
Poté jsme formalizovali podproblém výběru nejvíce relevantních řidičů, kterým má být zaslán požadavek na jízdu od pasažéra. Poté jsme navrhli jako vhodný model, kterým můžeme stávající mechanismus vylepšit, pravděpodobnostní klasifikátor.
Následně jsme provedli analýzu datasetu, který jsme měli pro tuto práci k dispozici. Pro uvedená data jsme také provedli vizualizace jednotlivých atributů. Pak jsme navrhli a implementovali řadu metod na extrakci "featur" z dat.
V následující sekci jsme implementovali několik skriptů v Pythonu, které nám umožňují naučit modely z dat. Konkrétně jsme naučili model K nejbližších sousedů, naivní bayes a les rozhodovacích stromů. Pro všechny modely jsme experimentovali s různými "featurami" z dat a s dalšími "featurami", které jsme z dat museli odvodit nebo dopočítat.
Nakonec jsme provedli evaluaci zmíněných modelů, a to evaluaci samostatných modelů a následně evaluaci jednotlivých modelů jako součást celého mechanismu. Na konci evaluace jsme také navrhli několik doporučení k následné implementaci mechanismu do reálného provozu. In our work we have first formalized the matchmaking mechanism that is currently used as a part of the novel taxi booking system using smart phone applications. Then we have identified the system that is selecting the drivers to who the request should be sent as a critical place for the improvement of the existing mechanism.
Then we have formalized the sub-problem of selecting the particular most relevant drivers to who the request should be sent. After this formalization we have proposed the probabilistic classifier model as a one from possible and also very natural solution of how to improve the matchmaking mechanism.
Afterwards we have also analyzed the dataset that was available to us. We have also per- formed several visualizations of the data. Then we have implemented and experimented with several additional feature extraction methods from the available dataset.
In the next section of our work we have implemented several scripts in Python that easily enabled us to learn various kinds of models from the available data. We have particularly learned Naive Bayes model, K nearest neighbors and decision tree forest model. For all the mentioned models we have experimented with various features from those that were available directly form the data to those that we had to artificially derive and compute based on the various fields in the dataset.
At the end we have performed evaluation of all the mentioned models. We have first performed evaluations of the models on its own and then also as a integral part of the matchmaking mechanism. We have also come up with several recommendations towards the implementation of our proposed models into the real world production system of our industrial partner.
Collections
- Diplomové práce - 13136 [892]