Modely strojového učení pro identifikaci vzorů a prediktivní analýzu
Machine Learning Models for Pattern Identification and Predictive Analytics
Type of document
disertační prácedoctoral thesis
Author
Zagroz Abdulkhaliq Aziz
Supervisor
Bešťák Robert
Opponent
Kotuliak Ivan
Field of study
Telekomunikační technikaStudy program
Elektrotechnika a informatikaInstitutions assigning rank
katedra telekomunikační technikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
V posledních desetiletích zaznamenalo množství generovaných dat exponenciální růst. Rychlý růst dat vedl techniky dolování dat k tomu, aby hrály významnou roli při stanovování základních linií, měřítek, cílů, analýzy a lepšího porozumění konceptům. Získávání užitečných informací v datech však vyžaduje příslušné techniky a postupy. Naproti tomu proces identifikace vzoru v entitách nezpracovaných dat se stává náročnější. Vzorce jsou klíčem k porozumění, analýze, předpovídání a rozhodování. Na druhou stranu, hledání vzorců vyžaduje nejprve analýzu dat, strojové učení, umělou inteligenci a statistické modely. Tento proces se nazývá prediktivní analytika, což je proces využívání dat k předpovídání budoucích výsledků. V této práci byly představeny různé nové případové studie s použitím různých datových sad. Každá datová sada prošla předzpracováním. Předzpracování dat zahrnuje extrakci dat, sběr, profilování, redukci, hádky, obohacení a validaci před tím, než jsou studována. Každá případová studie představuje určitéproblémy a poskytuje řešení, přináší lepší analytické porozumění, vylepšení systému, zlepšení výsledků a přesnosti. Kromě toho bylo k řešení trendů a vzorců v datech použito několik statistických algoritmů a modelů a algoritmů strojového učení. Dále poskytujeme statistickou analýzu pomocí různých metodologií k identifikaci vzorců provozu, indikaci výkonu sítě a kvality služeb. Kromě toho jsme navrhli chování, detekci a predikci anomálií, které pomáhají provozovatelům sítí porozumět a předvídat takové chování sítě. Všechny tyto studie byly vyhodnoceny a posouzeny pomocí několika výkonnostních metrik a parametrů. In the last decades,the amount of data generated has seen exponential growth.The rapid growth of data led the data mining techniques to play a significant role in establishing base lines, benchmarks, objectives, analyzing and better understanding concepts. However,mining useful information in data requires relevant techniques and procedures. Incontrast,the process of pattern identification in the raw data entities becomes more challenging. Patterns are the key to understanding, analyzing, predicting and decision making. On the other hand, finding patterns needs first data analysis, machine learning, artificial intelligence, and statistical models.This process is called predictive analytics, which is the process of employ in data to forecast future outcomes. In this thesis, different novel case studies have been introduce dusing different datasets. Each dataset has gone through preprocessing. Data preprocessing includes data extraction, collection, profiling, reduction, wrangling, enrichment and validation before being studied. Every case study introduces certain problems and provides solutions, brings in better analytical understanding, system enhancement,outcomes and accuracy improvement. In addition, several statistical and machine learning algorithms and model shave been employed to address the trends and patterns in the data.Furthermore, we provide a statistical analysis using different methodologies to identify traffic patterns, indicate the network performance and quality of service. Moreover,we projected anomaly behavior, detection and prediction that helps network operators to understand and fore cast such network behaviors. All these studies have been evaluated and assessed using several performance metrics and parameters.
View/ Open
Collections
- Disertační práce - 13000 [730]