Zobrazit minimální záznam

Multi-stage Methods for Document Retrieval in the Czech Language



dc.contributor.advisorDrchal Jan
dc.contributor.authorBarbora Dědková
dc.date.accessioned2021-08-31T22:51:35Z
dc.date.available2021-08-31T22:51:35Z
dc.date.issued2021-08-31
dc.identifierKOS-1064879659105
dc.identifier.urihttp://hdl.handle.net/10467/97064
dc.description.abstractTato práce se zabývá úkolem vyhledávání dokumentů ve velkém měřítku pomocí vícesúrovňových metod pro hledání dokumentů. Kombinuje dvě fáze vyhledávání: předvýběr dokumentů a přeřazení dokumentů. Zvažuje klasické přístupy vyhledávání dokumentů jako jsou TF-IDF a BM25 v první fázi a moderní Transformers sítě ve druhé fázi. Vyhodnocuje a porovnává architektury Cross-Attention a Two-Tower v různých nastaveních.cze
dc.description.abstractThis work tackles the task of large-scale document retrieval by utilizing multi-stage methods for document retrieval. It combines two retrieval stages: document preselection and document reranking. It considers classic DR approaches such as TF-IDF and BM25 in the first stage and modern Transformer networks in the second stage. It evaluates and compares the Cross-Attention and Two-Tower architectures in various setups.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectvyhledávání dokumentůcze
dc.subjectfact-checkingcze
dc.subjecttransformerscze
dc.subjectvíceúrovňové vyhledávánícze
dc.subjectTF-IDFcze
dc.subjectBM25cze
dc.subjectdocument retrievaleng
dc.subjectfact-checkingeng
dc.subjecttransformerseng
dc.subjectmulti-stage retrievaleng
dc.subjectTF-IDFeng
dc.subjectBM25eng
dc.titleVíceúrovňové metody pro document retrieval nad českými textycze
dc.titleMulti-stage Methods for Document Retrieval in the Czech Languageeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeKuznetsov Stanislav
theses.degree.disciplineUmělá inteligencecze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu





Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam