Dolování znalostí z dat v oblasti silniční nehodovosti
Knowledge Discovery from Road Traffic Accident Data
Typ dokumentu
diplomová prácemaster thesis
Autor
Urbaniec Krzysztof Paweł
Vedoucí práce
Hrubeš Pavel
Oponent práce
Šimůnek Milan
Studijní obor
Inženýrská informatika v dopravě a spojíchStudijní program
Technika a technologie v dopravě a spojíchInstituce přidělující hodnost
ústav dopravní telematikyObhájeno
2015-06-18Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Tato práce se zabývá otázkou dolování znalostí z databází (DZD) v oblasti silniční nehodovosti. Hlavním cílem je posoudit možnosti aplikace metod data miningu na databázi nehod ve Středočeském kraji a prezentovat dosažené výsledky. Druhým cílem je pokusit se o využití geografických informačních systémů (GIS) v rámci dataminingových úloh včetně zhodnocení výsledků tohoto využití.
Práce se dělí do třech částí. V první části je za účelem uvedení čtenáře do problematiky DZD popsána metodika CRISP-DM, česká metoda GUHA a na ní založený systém LISp-Miner. Důraz je kladen zejména na vztahy, které lze v datech hledat pomocí jeho jednotlivých modulů. Druhá část se věnuje přípravě dat o nehodách před zpracováním s využitím systému LISp-Miner a pravidlům, kterými je vhodné se řídit během práce s tímto systémem. Jsou v ní podrobně popsány všechny úpravy, jaké byly během této fáze na datech provedeny. Třetí část je věnována popisu samotného zpracování dat systémem LISp-Miner. Nachází se zde podrobný popis osmi typů dataminingových úloh realizovaných na databázi nehod včetně úloh využívajících GIS. Důraz je kladen na nastavení každé úlohy a interpretaci výsledných hypotéz. V závěru jsou výsledky zhodnoceny a na jejich základě jsou formulována doporučení pro další výzkum. The thesis considers the process of knowledge discovery in databases of road traffic accidents (KDD). The main purposes of the thesis is to evaluate possibilities of applying data mining methods to the database of traffic accidents in Central Bohemia and to present the achieved results. The second purpose is to attempt to use the geographic information systems (GIS) in data mining tasks and to evaluate the results.
The thesis is divided into three parts. In the first part, the CRISP-DM process model, the Czech GUHA method, and the LISp-Miner system based on this method are depicted in order to introduce the reader to the topic of KDD. The focus lays especially on the relations to be searched in the database using particular modules of the LISp-Miner system. The second part describes the phase of data preparation before working with the LISp-Miner system and the rules of using it. All modifications and adjustments carried out during this phase are described here. The third part considers the process of data analysis using the LISp-Miner system. The detailed description of the eight types of executed data mining tasks including the tasks incorporating GIS information is to be found here. Particular attention is paid to the settings of each task and the interpretation of the achieved results. In the conclusion, the results are evaluated and possible directions to continue the research are suggested.