Unsupervised machine translation between Czech and German language
Unsupervised machine translation between Czech and German language
Type of document
bakalářská prácebachelor thesis
Author
Ivana Kvapilíková
Supervisor
Vašata Daniel
Opponent
Klouda Karel
Field of study
Znalostní inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra aplikované matematikyRights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Nedávný výzkum ukázal, že je možné navrhnout překladový systém, který se učí z čistě jednojazyčných textů. Ačkoli kvalita výsledného překladu stále zaostává za standardními systémy trénovanými pomocí textů předem přeložených člověkem, tyto výzkumné snahy otevírají nové možnosti pro datově chudé jazykové páry. Tato práce poskytuje přehled technik pro strojový překlad použitelných právě při nedostatku dat. Nejslibnější přístupy použijeme a porovnáváme jejich výsledky na česko-německém jazykovém páru. Jelikož použité metody závisí na vektorové reprezentaci slov ve vícejazyčném prostoru, zkoumáme tyto reprezentace, abychom ukázali, kolik nesou jazykově neutrální informace. Recent research has shown that it is possible to design a model that learns to translate entirely from monolingual texts. Even though the translation quality still lags behind the state-of-the art models trained on texts translated by humans, this line of research opens new doors for low-resource language pairs. This thesis provides an overview of unsupervised techniques for machine translation applicable in low-resource conditions. We apply the most promising approaches and compare their performance on the Czech-German language pair. Since the proposed methods depend on vector representations of words in a cross-lingual space, we experiment with these representations to show how much language-neutral information they carry.
Collections
- Bakalářské práce - 18105 [292]
Related items
Showing items related by title, author, creator and subject.
-
Návrh a simulace řídicích zákonů pro stabilizaci satelitů
Author: Mohanasundaram Sharathkumaar; Supervisor: Hromčík Martin; Opponent: Enmark Anita
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2017-05-30)In this thesis the problem of spacecraft attitude control is investigated. Individual spacecraft dynamics -
Rozšíření účtovacího systému pro detekci fraudu
Author: Nikulin Nikita; Supervisor: Troller Pavel; Opponent: Žalud Jiří
Tento finální projekt se zabývá Tvorba automatizovaných programu pro skenování fakturační údaje a vyhledávání typický a atypický podvodné provozu. Skripty jsou vytvořeny v PHP MySQL databáze prostředí. První kapitola tohoto ... -
Rozšíření účtovacího systému pro detekci fraudu
Author: Nikulin Nikita; Supervisor: Troller Pavel; Opponent: Žalud Jiří
Tento finální projekt se zabývá Tvorba automatizovaných programu pro skenování fakturační údaje a vyhledávání typický a atypický podvodné provozu. Skripty jsou vytvořeny v PHP MySQL databáze prostředí. První kapitola tohoto ...