Classifiers Explainable in the Latent Space

dc.contributor.advisor Šmídl, Václav
dc.contributor.author Daroshka, Alina
dc.contributor.referee Minarčík, Jiří
dc.date.accepted 2025-06-11
dc.date.accessioned 2025-06-06T22:55:32Z
dc.date.available 2025-06-06T22:55:32Z
dc.date.issued 2025-05-23
dc.description.abstract Tato práce se zabývá technikami vysvětlitelné umělé inteligence (XAI) pro detekci finančních podvodů, se zaměřením na interpretovatelnost modelů, které využívají latentní reprezentace. Ačkoli modely strojového učení dokážou účinně detekovat jemné vzory v komplexních transakčních datech, jejich netransparentnost zejména v naučeném latentním prostoru představuje překážku pro praktické využití i splnění regulatorních požadavků. Studie zkoumá dva hlavní přístupy k vysvětlování, založené na latentním prostoru. První přístup kombinuje lokální náhradní modely s výběrem sousedství v latentním prostoru, aby generoval detailní, na instanci zaměřená vysvětlení. Jako referenční metoda pro srovnání interpretovatelnosti je využito přiřazování důležitosti vstupních atributů pomocí metody SHAP. Druhý přístup adaptuje metodu založenou na prototypech, kde jsou predikce vysvětlovány na základě podobnosti s naučenými latentními prototypy, které jsou následně přiřazeny k reprezentativním trénovacím příkladům pro zajištění interpretace. Experimenty na rozsáhlém datovém souboru finančních transakcí ukazují specifické výhody i omezení obou přístupů. Modely s latentním sousedstvím dokáží zachytit jemné lokální chování, avšak jejich účinnost výrazně závisí na struktuře latentního prostoru a kvalitě zvolených sousedů. Naproti tomu vysvětlení založená na prototypech poskytují konzistentní a srozumitelná odůvodnění, i když mohou postrádat větší hloubku bez dodatečné sémantické strukturalizace. Výsledky poukazují na potenciál interpretačních technik v latentním prostoru a naznačují možnosti dalšího zlepšení prostřednictvím cílené strukturalizace latentního prostoru a zapojení odborníků do procesu vysvětlování. cs
dc.description.abstract This work investigates explainable artificial intelligence (XAI) techniques for financial fraud detection, with a focus on interpretability in models that rely on latent representations. While machine learning models can effectively detect subtle patterns in complex transaction data, their lack of transparency particularly in learned latent spaces poses challenges for practical and regulatory use. The study explores two primary explanation strategies grounded in latent space. The first combines local surrogate models with latent neighborhood selection to generate fine-grained, instance-specific explanations. SHAP-based feature attributions are employed as a baseline to benchmark the interpretability of this approach. The second strategy adapts a prototype-based method, where predictions are explained through similarity to learned latent prototypes, which are later anchored to representative training examples for interpretability. Experiments on a large-scale transaction dataset highlight distinct strengths and limitations of each method. While latent neighborhood models can capture nuanced local behavior, their performance depends heavily on the structure of the latent space and the quality of selected neighbors. Prototype-based explanations, by contrast, offer consistent and self-contained justifications, though they may lack explanatory depth without further semantic structuring. The findings underscore the potential of latent-space interpretability techniques and point toward future improvements through refined latent structuring and expert-in-the-loop guidance. en
dc.identifier KOS-1243591499005
dc.identifier.uri http://hdl.handle.net/10467/122687
dc.language.iso eng
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.subject Detekce anomálií cs
dc.subject Detekce podvodů cs
dc.subject Interpretovatelnost cs
dc.subject ProtoPNet cs
dc.subject Triplet loss cs
dc.subject Vysvětlitelná umělá inteligence cs
dc.subject Finanční podvody cs
dc.subject Latentní prostor cs
dc.subject Autoenkodér cs
dc.subject SHAP cs
dc.subject Lasso cs
dc.subject Anomaly detection en
dc.subject Fraud detection en
dc.subject Interpretability en
dc.subject ProtoPNet en
dc.subject Triplet loss en
dc.subject Explainable AI en
dc.subject Financial fraud en
dc.subject Latent space en
dc.subject Autoencoder en
dc.subject SHAP en
dc.subject Lasso en
dc.title Klasifikátory vysvětlitelné v latentním prostoru cs
dc.title Classifiers Explainable in the Latent Space en
dc.type bakalářská práce cs
dc.type bachelor thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication cd6b86bc-b4ce-466a-9a46-8090950593aa
relation.isAdvisorOfPublication.latestForDiscovery cd6b86bc-b4ce-466a-9a46-8090950593aa
relation.isAuthorOfPublication fce87de9-1378-48d7-a290-0c863cb1cc23
relation.isAuthorOfPublication.latestForDiscovery fce87de9-1378-48d7-a290-0c863cb1cc23
theses.degree.grantor katedra kybernetiky cs
theses.degree.programme Otevřená informatika cs

Files

Original bundle

Now showing 1 - 5 of 5
Name:
Posudek_vedouciho_na_BP- Alina Daroshka.pdf
Size:
100.6 KB
Format:
Adobe Portable Document Format
Description:
REVIEW
Access level:
OPEN
Access rights:
openly accessible
Name:
Posudek-oponent_en.pdf
Size:
197.37 KB
Format:
Adobe Portable Document Format
Description:
REVIEW
Access level:
OPEN
Access rights:
openly accessible
Name:
F3-BP-2025-Daroshka-Alina-BP_darosali.pdf
Size:
32.13 MB
Format:
Adobe Portable Document Format
Description:
THESIS
Access level:
OPEN
Access rights:
openly accessible
Name:
F3-BP-2025-Daroshka-Alina-priloha-source_code.zip
Size:
9.47 KB
Format:
Unknown data format
Description:
ATTACHMENT
Access level:
OPEN
Access rights:
openly accessible
Name:
Prubeh-obhajoby.pdf
Size:
613.32 KB
Format:
Adobe Portable Document Format
Description:
DEFENSE_PROCEEDINGS
Access level:
OPEN
Access rights:
openly accessible