Show simple item record

Context-Aware Prediction of Inflectional Word-forms



dc.contributor.advisorPichl Jan
dc.contributor.authorVan Duy Ta
dc.date.accessioned2021-06-15T22:52:01Z
dc.date.available2021-06-15T22:52:01Z
dc.date.issued2021-06-15
dc.identifierKOS-960815824305
dc.identifier.urihttp://hdl.handle.net/10467/95317
dc.description.abstractStandardní formulace úlohy predikce slovních tvarů je predikce cílového tvaru slova, když je zadaný základní tvar a jeho morfo-syntaktické značky. Typické využití predikce slovních tvarů zahrnuje automatickou opravu textu, strojový překlad a obohacování korpusů. Cílem naší práce je vytvořit model, který predikuje slovní tvar ze zadaného základního tvaru a kontextu věty namísto spoléhání se na další vstupy, jako například na morfo-syntaktické značky. V naší práci jsme zkonstruovali českou datovou sadu pro trénink, validaci a vyhodnocení kontextově informované predikce inflexních forem. Dále jsme navrhli dva přístupy řešící zkoumaný problém. Na závěr jsme provedli automatické i lidské hodnocení navrhovaných přístupů.cze
dc.description.abstractStandard word form prediction is the task of predicting the target word-form given its base-form and morpho-syntactic tags. The typical use cases include automatic text correction, machine translation, and corpora enrichment. The aim of our thesis is to create an infection prediction model that predicts the target inflection from the input base-form and the sentence context instead of relying on other additional inputs like morpho-syntactic tags. In our work, we constructed a Czech dataset for the training, validation, and evaluation of the context-aware prediction of inflectional forms. Furthermore, we proposed two approaches for the prediction task. Finally, we performed both automatic and human evaluations of the proposed models.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectInflekcecze
dc.subjectTvaroslovícze
dc.subjectTransformerscze
dc.subjectEncoder-Decodercze
dc.subjectSequence-to-Sequencecze
dc.subjectZpracování přirozeného jazykacze
dc.subjectNeuronové sítěcze
dc.subjectInflectioneng
dc.subjectMorphologyeng
dc.subjectTransformerseng
dc.subjectEncoder-Decodereng
dc.subjectSequence-to-Sequenceeng
dc.subjectNatural Language Processingeng
dc.subjectNeural Networkseng
dc.titleKontextově informovaná predikce slovních tvarůcze
dc.titleContext-Aware Prediction of Inflectional Word-formseng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeChudáček Václav
theses.degree.disciplineDatové vědycze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Files in this item





This item appears in the following Collection(s)

Show simple item record