Vizualizace chování algoritmů strojového učení po doplnění chybějících dat
Visualization of machine learning algorithms with imputed data
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Naďa Fučelová
Vedoucí práce
Friedjungová Magda
Oponent práce
Vašata Daniel
Studijní obor
Umělá inteligence 2021Studijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Dátové sady tvoria neoddeliteľnú súčasť strojového učenia, zohrávajú kľúčovú rolu pri trénovaní modelov a v konečnom dôsledku formujú ich predikcie. V reálnych dátových sadách však často niektoré hodnoty chýbajú, čo môže spôsobovať širokú škálu problémov od zníženej presnosti až po neschopnosť niektoré algoritmy vôbec použiť. Táto práca sa zaoberá skúmaním metód dopĺňania chýbajúcich hodnôt v tabulárnych dátových sadách a ich vplyvu na vybrané algoritmy strojového učenia. Výsledkom je webová aplikácia, ktorá má za cieľ uľahčiť pochopenie tejto problematiky. Aplikácia umožňuje na používateľom nahranú dátovú sadu aplikovať vybrané metódy a následne pozorovať ich vplyv na zvolený algoritmus strojového učenia prostredníctvom vizualizácií. Práca ďalej obsahuje niekoľko praktických ukážok použitia aplikácie na známych dátových sadách sprevádzaných diskusiou dosiahnutých výsledkov. Datasets are an integral part of machine learning, playing a key role in the training of models and shaping their predictions. However, real-world datasets often contain missing values, which can cause a wide range of problems from reducing their accuracy to the inability to apply some algorithms at all. This thesis examines data imputation techniques in tabular datasets and their impact on selected machine learning algorithms. The result of this thesis is a web application that aims to provide a better understanding of the given issue. The application allows users to apply selected techniques to the uploaded dataset and observe their effects on chosen machine learning algorithms through visualizations. Additionally, the thesis includes several practical examples of application use on common datasets, accompanied by a discussion of the achieved results.
Kolekce
- Bakalářské práce - 18105 [292]