Zobrazit minimální záznam

Multitask Learning for NLP Classifiers



dc.contributor.advisorDrchal Jan
dc.contributor.authorDanil Semin
dc.date.accessioned2023-06-13T22:52:54Z
dc.date.available2023-06-13T22:52:54Z
dc.date.issued2023-06-13
dc.identifierKOS-1197737653005
dc.identifier.urihttp://hdl.handle.net/10467/109243
dc.description.abstractNedávné inovace v oblasti zpracování přirozeného jazyka (anglicky natural language processing, NLP) umožnily vytvoření obecnějších neuronových jazykových modelů, které efektivně řeší více úloh v různých přirozených jazycích najednou. Tyto pokroky jsou výsledkem vývoje nových neuronových architektur, využívání metod vícejazyčného předtrénování a uplatnění víceúlohového učení (anglicky multitask learning, MTL). V návaznosti na tyto úspěchy se tato práce zaměřuje na zlepšení výkonu stávajících vícejazyčných neuronových klasifikátorů textů s využitím metod MTL, což vede k vývoji modelů, které kompetitivně řeší 6 úloh v 17 jazycích a dosahují tzv. state-of-the-art výsledků v úloze ověřování faktů (anglicky fact checking) v češtině, ČTKFactsNLI.cze
dc.description.abstractRecent advancements in the field of natural language processing (NLP) have led to more generalized neural language models that effectively tackle multiple tasks across diverse natural languages simultaneously. These advancements are driven by the development of novel neural architectures, the utilization of multilingual pre-training methods, and the deployment of multitask learning (MTL). Building upon these achievements, this thesis focuses on improving the performance of existing multilingual neural text classifiers by leveraging MTL methods, resulting in the development of models that competitively handle 6 tasks in 17 languages and achieve state-of-the-art results on the Czech fact-checking task, CTKFactsNLI.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectNLPcze
dc.subjectMTLcze
dc.subjecttext classificationcze
dc.subjectNLIcze
dc.subjecttask embeddingscze
dc.subjectLoRAcze
dc.subjectmultilingualcze
dc.subjectNLPeng
dc.subjectMTLeng
dc.subjecttext classificationeng
dc.subjectNLIeng
dc.subjecttask embeddingseng
dc.subjectLoRAeng
dc.subjectmultilingualeng
dc.titleVíceúlohové učení pro NLP klasifikátorycze
dc.titleMultitask Learning for NLP Classifierseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeKordík Pavel
theses.degree.disciplineZáklady umělé inteligence a počítačových vědcze
theses.degree.grantorkatedra kybernetikycze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam