Vliv architektury klasifikačního modelu na detekci anomálií v textu
Influence of Classification Model Architecture on Anomaly Detection in Text
Type of document
bakalářská prácebachelor thesis
Author
Tommaso Gargiani
Supervisor
Lorenc Petr
Opponent
Kuznetsov Stanislav
Field of study
Základy umělé inteligence a počítačových vědStudy program
Otevřená informatikaInstitutions assigning rank
katedra kybernetikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Konverzační agenti pracují v různých prostředích. V open world prostředí hraje důležitou roli jak rozpoznávání předdefinovaných in-domain intentů, tak detekce neznámých out-of-domain anomálií. V této práci zkoumáme různé metody určené pro detekci anomálií a představujeme novou metodu, která je nezávislá na out-of-domain datech. Metody jsou následně porovnány s ohledem na in-domain přesnost, out-of-domain recall, false rejection rate a časové a paměťové požadavky. Ohodnocení metod na několika datasetech ukazuje, že námi představená metoda výrazně překonává již zavedené metody. Conversational agents operate in various environments. In the open world environment, both recognition of predefined in-domain intents and detection of unknown out-of-domain anomalies play a crucial role. In this thesis, we review several methods for anomaly detection and propose a novel method that is independent of out-of-domain data. The methods are then compared in respect to in-domain accuracy, out-of-domain recall, false rejection rate and time and memory requirements. Evaluations on a variety of datasets show that Our Proposed Method significantly outperforms the current state-of-the-art.
Collections
- Bakalářské práce - 13133 [706]