Modul pro detekci kontextů v doméně internetového bankovnictví v českém jazyce
Module for intent detection in the internet banking domain for the Czech language
Typ dokumentu
diplomová prácemaster thesis
Autor
Samuel Fabo
Vedoucí práce
Kuznetsov Stanislav
Oponent práce
Vašata Daniel
Studijní obor
Znalostní inženýrstvíStudijní program
Informatika 2010Instituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
V tejto práci sa zaoberáme výskumom a aplikáciou rôznych techník na riešenie problému intent detection (alebo aj detekcia kontextov, zámerov) v doméne českého bankovníctva. Intent detection je základ každého dobrého chatbota a ak je detekcia kvalitná a vyladená, udrží užívateľa dlhšie v kontakte so strojom. Keďže neexistujú voľne dostupné dátové sady v českom jazyku na túto doménu, museli sme dáta zozbierať sami. Neskôr sme spojili zozbierané vzorky intentov s voľne dostupnou sadou BANKING77, ktorú sme preložili do češtiny. Podarilo sa nám vyladiť model, ktorý mal na testovacej vzorke spojenej dátovej sady dobré výsledky presnosti. Nakoniec sme nasadili výsledný model do demonštračnej aplikácie. In this thesis, we research and apply various techniques to solve the intent detection problem in the Czech internet banking domain. The intent detector is a fundamental part of each chatbot and keeps the user longer in contact with the machine if a high-quality, fine-tuned detector is used. We needed to gather the training data on our own because there are no publicly available datasets in the Czech language for this domain. Later on, we merged gathered samples of intents with the publicly available dataset BANKING77, which we translated into the Czech language. We succeeded in fine-tuning a model, which had good accuracy results on the test set. We deployed the model to the production version of the demo application.
Kolekce
- Diplomové práce - 18105 [194]