Unsupervised machine translation between Czech and German language
Unsupervised machine translation between Czech and German language
dc.contributor.advisor | Vašata Daniel | |
dc.contributor.author | Ivana Kvapilíková | |
dc.date.accessioned | 2020-01-30T23:51:59Z | |
dc.date.available | 2020-01-30T23:51:59Z | |
dc.date.issued | 2020-01-30 | |
dc.identifier | KOS-775229808005 | |
dc.identifier.uri | http://hdl.handle.net/10467/86196 | |
dc.description.abstract | Nedávný výzkum ukázal, že je možné navrhnout překladový systém, který se učí z čistě jednojazyčných textů. Ačkoli kvalita výsledného překladu stále zaostává za standardními systémy trénovanými pomocí textů předem přeložených člověkem, tyto výzkumné snahy otevírají nové možnosti pro datově chudé jazykové páry. Tato práce poskytuje přehled technik pro strojový překlad použitelných právě při nedostatku dat. Nejslibnější přístupy použijeme a porovnáváme jejich výsledky na česko-německém jazykovém páru. Jelikož použité metody závisí na vektorové reprezentaci slov ve vícejazyčném prostoru, zkoumáme tyto reprezentace, abychom ukázali, kolik nesou jazykově neutrální informace. | cze |
dc.description.abstract | Recent research has shown that it is possible to design a model that learns to translate entirely from monolingual texts. Even though the translation quality still lags behind the state-of-the art models trained on texts translated by humans, this line of research opens new doors for low-resource language pairs. This thesis provides an overview of unsupervised techniques for machine translation applicable in low-resource conditions. We apply the most promising approaches and compare their performance on the Czech-German language pair. Since the proposed methods depend on vector representations of words in a cross-lingual space, we experiment with these representations to show how much language-neutral information they carry. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | neuronový strojový překlad | cze |
dc.subject | nesupervizovaný strojový překlad | cze |
dc.subject | jednojazyčný korpus | cze |
dc.subject | vícejazyčné reprezentace slov | cze |
dc.subject | XLM | cze |
dc.subject | BERT | cze |
dc.subject | česko-německý překlad | cze |
dc.subject | neural machine translation | eng |
dc.subject | unsupervised machine translation | eng |
dc.subject | monolingual corpus | eng |
dc.subject | cross-lingual embeddings | eng |
dc.subject | XLM | eng |
dc.subject | BERT | eng |
dc.subject | German-Czech translation | eng |
dc.title | Unsupervised machine translation between Czech and German language | cze |
dc.title | Unsupervised machine translation between Czech and German language | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Klouda Karel | |
theses.degree.discipline | Znalostní inženýrství | cze |
theses.degree.grantor | katedra aplikované matematiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18105 [292]