Zobrazit minimální záznam

Automated exploratory data analysis for binary classification using pandas profiling library



dc.contributor.advisorVašata Daniel
dc.contributor.authorJan Čáp
dc.date.accessioned2023-06-16T22:52:01Z
dc.date.available2023-06-16T22:52:01Z
dc.date.issued2023-06-16
dc.identifierKOS-1089751673005
dc.identifier.urihttp://hdl.handle.net/10467/109554
dc.description.abstractPráce se zabývá automatickou explorací dat s binární klasifikací. Je provedena rešerše již existujících řešení pro automatickou exploraci dat. Dále jsou prozkoumány statistické testy a metody vhodné pro testování závislosti dvou proměnných. Jsou zde také prozkoumány vhodné možnosti vizualizací rozložení dat. V další části je navrženo rozšíření do knihovny \textit{Pandas Profiling}, která byla vybrána v rešerši. Rozšíření se specializuje na binární klasifikaci. Rozšíření obsahuje grafy a statistiky reprezentující závislost sloupců na cílové proměnné, vizualizaci závislostí chybějících hodnot na cílové proměnné, navržené transformace sloupců a trénování výchozího modelu pro~klasifikaci cílové proměnné. Na základě návrhu bylo implementováno rozšíření knihovny \textit{Pandas Profiling}, které urychlí exploraci dat s binární klasifikací.cze
dc.description.abstractThis work deals with automatic data exploration with binary classification. A search of already existing solutions for automatic data exploration is performed. Furthermore, statistical tests and~methods suitable for testing the dependence of two variables are investigated. Suitable options for~data distribution visualizations are also explored. In the next section, an extension to~the~\textit{Pandas Profiling} library selected in the search is proposed. The extension specializes in~binary classification. The extension includes graphs and statistics representing the dependency of~columns on the target variable, visualization of the dependency of missing values on~the~target variable, proposed column transformations and training of the default model for target variable classification. Based on the design, an extension to the \textit{Pandas Profiling} library was implemented to speed up data exploration with binary classification.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectrozšíření knihovnycze
dc.subjectknihovna Pandas Profilingcze
dc.subjectautomatická explorace datcze
dc.subjectbinární klasifikacecze
dc.subjectdatascience komunitacze
dc.subjectPythoncze
dc.subjectlibrary extensioneng
dc.subjectPandas Profilingeng
dc.subjectautomatic explorationeng
dc.subjectbinary classificationeng
dc.subjectdatascience communityeng
dc.subjectPythoneng
dc.titleAutomatická explorační analýza dat pro binární klasifikaci pomocí knihovny pandas profilingcze
dc.titleAutomated exploratory data analysis for binary classification using pandas profiling libraryeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeFriedjungová Magda
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatika 2009cze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam