Unsupervised machine translation between Czech and German language
Unsupervised machine translation between Czech and German language
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Ivana Kvapilíková
Vedoucí práce
Vašata Daniel
Oponent práce
Klouda Karel
Studijní obor
Znalostní inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Nedávný výzkum ukázal, že je možné navrhnout překladový systém, který se učí z čistě jednojazyčných textů. Ačkoli kvalita výsledného překladu stále zaostává za standardními systémy trénovanými pomocí textů předem přeložených člověkem, tyto výzkumné snahy otevírají nové možnosti pro datově chudé jazykové páry. Tato práce poskytuje přehled technik pro strojový překlad použitelných právě při nedostatku dat. Nejslibnější přístupy použijeme a porovnáváme jejich výsledky na česko-německém jazykovém páru. Jelikož použité metody závisí na vektorové reprezentaci slov ve vícejazyčném prostoru, zkoumáme tyto reprezentace, abychom ukázali, kolik nesou jazykově neutrální informace. Recent research has shown that it is possible to design a model that learns to translate entirely from monolingual texts. Even though the translation quality still lags behind the state-of-the art models trained on texts translated by humans, this line of research opens new doors for low-resource language pairs. This thesis provides an overview of unsupervised techniques for machine translation applicable in low-resource conditions. We apply the most promising approaches and compare their performance on the Czech-German language pair. Since the proposed methods depend on vector representations of words in a cross-lingual space, we experiment with these representations to show how much language-neutral information they carry.
Kolekce
- Bakalářské práce - 18105 [244]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Návrh a simulace řídicích zákonů pro stabilizaci satelitů
Autor: Mohanasundaram Sharathkumaar; Vedoucí práce: Hromčík Martin; Oponent práce: Enmark Anita
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2017-05-30)In this thesis the problem of spacecraft attitude control is investigated. Individual spacecraft dynamics -
Rozšíření účtovacího systému pro detekci fraudu
Autor: Nikulin Nikita; Vedoucí práce: Troller Pavel; Oponent práce: Žalud Jiří
Tento finální projekt se zabývá Tvorba automatizovaných programu pro skenování fakturační údaje a vyhledávání typický a atypický podvodné provozu. Skripty jsou vytvořeny v PHP MySQL databáze prostředí. První kapitola tohoto ... -
Rozšíření účtovacího systému pro detekci fraudu
Autor: Nikulin Nikita; Vedoucí práce: Troller Pavel; Oponent práce: Žalud Jiří
Tento finální projekt se zabývá Tvorba automatizovaných programu pro skenování fakturační údaje a vyhledávání typický a atypický podvodné provozu. Skripty jsou vytvořeny v PHP MySQL databáze prostředí. První kapitola tohoto ...