Kontextově informovaná predikce slovních tvarů

Van Duy Ta

Context-Aware Prediction of Inflectional Word-forms

dc.contributor.advisor	Pichl Jan
dc.contributor.author	Van Duy Ta
dc.date.accessioned	2021-06-15T22:52:01Z
dc.date.available	2021-06-15T22:52:01Z
dc.date.issued	2021-06-15
dc.identifier	KOS-960815824305
dc.identifier.uri	http://hdl.handle.net/10467/95317
dc.description.abstract	Standardní formulace úlohy predikce slovních tvarů je predikce cílového tvaru slova, když je zadaný základní tvar a jeho morfo-syntaktické značky. Typické využití predikce slovních tvarů zahrnuje automatickou opravu textu, strojový překlad a obohacování korpusů. Cílem naší práce je vytvořit model, který predikuje slovní tvar ze zadaného základního tvaru a kontextu věty namísto spoléhání se na další vstupy, jako například na morfo-syntaktické značky. V naší práci jsme zkonstruovali českou datovou sadu pro trénink, validaci a vyhodnocení kontextově informované predikce inflexních forem. Dále jsme navrhli dva přístupy řešící zkoumaný problém. Na závěr jsme provedli automatické i lidské hodnocení navrhovaných přístupů.	cze
dc.description.abstract	Standard word form prediction is the task of predicting the target word-form given its base-form and morpho-syntactic tags. The typical use cases include automatic text correction, machine translation, and corpora enrichment. The aim of our thesis is to create an infection prediction model that predicts the target inflection from the input base-form and the sentence context instead of relying on other additional inputs like morpho-syntactic tags. In our work, we constructed a Czech dataset for the training, validation, and evaluation of the context-aware prediction of inflectional forms. Furthermore, we proposed two approaches for the prediction task. Finally, we performed both automatic and human evaluations of the proposed models.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	Inflekce	cze
dc.subject	Tvarosloví	cze
dc.subject	Transformers	cze
dc.subject	Encoder-Decoder	cze
dc.subject	Sequence-to-Sequence	cze
dc.subject	Zpracování přirozeného jazyka	cze
dc.subject	Neuronové sítě	cze
dc.subject	Inflection	eng
dc.subject	Morphology	eng
dc.subject	Transformers	eng
dc.subject	Encoder-Decoder	eng
dc.subject	Sequence-to-Sequence	eng
dc.subject	Natural Language Processing	eng
dc.subject	Neural Networks	eng
dc.title	Kontextově informovaná predikce slovních tvarů	cze
dc.title	Context-Aware Prediction of Inflectional Word-forms	eng
dc.type	diplomová práce	cze
dc.type	master thesis	eng
dc.contributor.referee	Chudáček Václav
theses.degree.discipline	Datové vědy	cze
theses.degree.grantor	katedra počítačů	cze
theses.degree.programme	Otevřená informatika	cze

Soubory tohoto záznamu

Název:: F3-DP-2021-Ta-Van Duy-opravena ...
Velikost:: 1.697Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-DP-2021-Ta-Van Duy-priloha- ...
Velikost:: 3.644Mb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-DP-2021-posudek-Chudacek_Va ...
Velikost:: 86.71Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-DP-2021-posudek-Pichl_Jan.pdf
Velikost:: 202.0Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Diplomové práce - 13136 [892]

Zobrazit minimální záznam