Zobrazit minimální záznam

Unsupervised machine translation between Czech and German language



dc.contributor.advisorVašata Daniel
dc.contributor.authorIvana Kvapilíková
dc.date.accessioned2020-01-30T23:51:59Z
dc.date.available2020-01-30T23:51:59Z
dc.date.issued2020-01-30
dc.identifierKOS-775229808005
dc.identifier.urihttp://hdl.handle.net/10467/86196
dc.description.abstractNedávný výzkum ukázal, že je možné navrhnout překladový systém, který se učí z čistě jednojazyčných textů. Ačkoli kvalita výsledného překladu stále zaostává za standardními systémy trénovanými pomocí textů předem přeložených člověkem, tyto výzkumné snahy otevírají nové možnosti pro datově chudé jazykové páry. Tato práce poskytuje přehled technik pro strojový překlad použitelných právě při nedostatku dat. Nejslibnější přístupy použijeme a porovnáváme jejich výsledky na česko-německém jazykovém páru. Jelikož použité metody závisí na vektorové reprezentaci slov ve vícejazyčném prostoru, zkoumáme tyto reprezentace, abychom ukázali, kolik nesou jazykově neutrální informace.cze
dc.description.abstractRecent research has shown that it is possible to design a model that learns to translate entirely from monolingual texts. Even though the translation quality still lags behind the state-of-the art models trained on texts translated by humans, this line of research opens new doors for low-resource language pairs. This thesis provides an overview of unsupervised techniques for machine translation applicable in low-resource conditions. We apply the most promising approaches and compare their performance on the Czech-German language pair. Since the proposed methods depend on vector representations of words in a cross-lingual space, we experiment with these representations to show how much language-neutral information they carry.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectneuronový strojový překladcze
dc.subjectnesupervizovaný strojový překladcze
dc.subjectjednojazyčný korpuscze
dc.subjectvícejazyčné reprezentace slovcze
dc.subjectXLMcze
dc.subjectBERTcze
dc.subjectčesko-německý překladcze
dc.subjectneural machine translationeng
dc.subjectunsupervised machine translationeng
dc.subjectmonolingual corpuseng
dc.subjectcross-lingual embeddingseng
dc.subjectXLMeng
dc.subjectBERTeng
dc.subjectGerman-Czech translationeng
dc.titleUnsupervised machine translation between Czech and German languagecze
dc.titleUnsupervised machine translation between Czech and German languageeng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeKlouda Karel
theses.degree.disciplineZnalostní inženýrstvícze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam