Knowledge Discovery from Road Traffic Accident Data

Dolování znalostí z dat v oblasti silniční nehodovosti

Supervisors

Editors

Other contributors

Journal Title

Journal ISSN

Volume Title

Publisher

České vysoké učení technické v Praze
Czech Technical University in Prague

Date of defense

2015-06-18

Research Projects

Organizational Units

Journal Issue

Abstract

Tato práce se zabývá otázkou dolování znalostí z databází (DZD) v oblasti silniční nehodovosti. Hlavním cílem je posoudit možnosti aplikace metod data miningu na databázi nehod ve Středočeském kraji a prezentovat dosažené výsledky. Druhým cílem je pokusit se o využití geografických informačních systémů (GIS) v rámci dataminingových úloh včetně zhodnocení výsledků tohoto využití. Práce se dělí do třech částí. V první části je za účelem uvedení čtenáře do problematiky DZD popsána metodika CRISP-DM, česká metoda GUHA a na ní založený systém LISp-Miner. Důraz je kladen zejména na vztahy, které lze v datech hledat pomocí jeho jednotlivých modulů. Druhá část se věnuje přípravě dat o nehodách před zpracováním s využitím systému LISp-Miner a pravidlům, kterými je vhodné se řídit během práce s tímto systémem. Jsou v ní podrobně popsány všechny úpravy, jaké byly během této fáze na datech provedeny. Třetí část je věnována popisu samotného zpracování dat systémem LISp-Miner. Nachází se zde podrobný popis osmi typů dataminingových úloh realizovaných na databázi nehod včetně úloh využívajících GIS. Důraz je kladen na nastavení každé úlohy a interpretaci výsledných hypotéz. V závěru jsou výsledky zhodnoceny a na jejich základě jsou formulována doporučení pro další výzkum.

The thesis considers the process of knowledge discovery in databases of road traffic accidents (KDD). The main purposes of the thesis is to evaluate possibilities of applying data mining methods to the database of traffic accidents in Central Bohemia and to present the achieved results. The second purpose is to attempt to use the geographic information systems (GIS) in data mining tasks and to evaluate the results. The thesis is divided into three parts. In the first part, the CRISP-DM process model, the Czech GUHA method, and the LISp-Miner system based on this method are depicted in order to introduce the reader to the topic of KDD. The focus lays especially on the relations to be searched in the database using particular modules of the LISp-Miner system. The second part describes the phase of data preparation before working with the LISp-Miner system and the rules of using it. All modifications and adjustments carried out during this phase are described here. The third part considers the process of data analysis using the LISp-Miner system. The detailed description of the eight types of executed data mining tasks including the tasks incorporating GIS information is to be found here. Particular attention is paid to the settings of each task and the interpretation of the achieved results. In the conclusion, the results are evaluated and possible directions to continue the research are suggested.

Description

Citation

Underlying research data set URL

Rights/License

A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.

Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.

Endorsement

Review

Supplemented By

Referenced By