Dvojjazyčné vyhledávání v dokumentech

Lukáš Rynt

Bilingual search in documents

dc.contributor.advisor	Bernhauer David
dc.contributor.author	Lukáš Rynt
dc.date.accessioned	2022-06-11T22:52:47Z
dc.date.available	2022-06-11T22:52:47Z
dc.date.issued	2022-06-11
dc.identifier	KOS-1065790682505
dc.identifier.uri	http://hdl.handle.net/10467/101906
dc.description.abstract	Tato práce se zabývá výzkumem modelů získávání informací, nejmodernějších technik vnoření slov (word embedding) a jejich možným využitím pro vícejazyčné vyhledávání. Moderní přístupy k vícejazyčnému vyhledávání, které staví na word embedding technikách, většinou pracují s~urči\-tou transformací, která převádí reprezentace slov z jednoho jazyka do druhého. Cílem této práce je zkoumat model, který s touto transformací nepracuje a namísto toho rovnou získává závislosti mezi překlady. Nad tímto modelem by pak měl být vystavěn prototyp webového vyhledávače. Práce v tomto dostála všem očekáváním a výsledný model byl schopný reprezentovat dvojjazyčné překlady napřímo bez použití jakékoliv transformace. Toho bylo dosaženo s využitím paralelně přeložených dokumentů Evropské Unie, které byly pro oba jazyky spojeny na úrovni odstavců. Prototyp vyhledávače poté fungoval na základě naučených reprezentací jednotlivých slov, vyvozených z tohoto modelu.	cze
dc.description.abstract	This thesis is concerned with the research of information retrieval models, state-of-the-art word embedding techniques and their possible use for multilingual retrieval. Modern approaches to multilingual retrieval that build on word embedding techniques usually work with some transformation that converts word representations from one language to another. The aim of this thesis is to investigate a model that does not work with this transformation and instead directly extracts dependencies between translations. A prototype web search engine should then be built on top of this model. The work has met all expectations and the resulting model was able to represent bilingual translations directly without using any transformation. This was achieved using parallel translated European Union documents, which were linked at paragraph level for both languages. The prototype search engine then operated based on the learned word representations derived from this model.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	získávání informací	cze
dc.subject	přirozené zpracování textu	cze
dc.subject	vnoření slov	cze
dc.subject	Word2Vec	cze
dc.subject	více\-jazyčné vyhledávání	cze
dc.subject	vektorový model	cze
dc.subject	information retrieval	eng
dc.subject	natural language processing	eng
dc.subject	word embedding	eng
dc.subject	Word2Vec	eng
dc.subject	mutilingual information retrieval	eng
dc.subject	vector space model	eng
dc.title	Dvojjazyčné vyhledávání v dokumentech	cze
dc.title	Bilingual search in documents	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.contributor.referee	Kroha Petr
theses.degree.discipline	Znalostní inženýrství	cze
theses.degree.grantor	katedra aplikované matematiky	cze
theses.degree.programme	Informatika 2009	cze

Soubory tohoto záznamu

Název:: F8-BP-2022-Rynt-Lukas-thesis.pdf
Velikost:: 1.337Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F8-BP-2022-posudek-Kroha_Petr.pdf
Velikost:: 44.83Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F8-BP-2022-posudek-Bernhauer_D ...
Velikost:: 43.94Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 18105 [295]

Zobrazit minimální záznam