Show simple item record

Robojudge - analysis of court judgments



dc.contributor.advisorSzabó Adam
dc.contributor.authorMiroslav Řehounek
dc.date.accessioned2024-06-20T22:52:11Z
dc.date.available2024-06-20T22:52:11Z
dc.date.issued2024-06-20
dc.identifierKOS-1240469314305
dc.identifier.urihttp://hdl.handle.net/10467/115968
dc.description.abstractPráce se zabývá způsoby využití velkých jazykových modelů (large language model, LLM) k analýze veřejně dostupných rozhodnutí českých soudů. Hlavním cílem práce bylo lépe zpřístupnit tato rozhodnutí, a to vytvořením webové aplikace Robojudge, která umožní v databázi zveřejněných rozhodnutí vyhledávat pomocí nového typu uživatelského rozhraní využívajícího ve svém základu LLM k sémantickému vyhledávání, shrnování a odpovídání na otázky týkající se jednotlivých rozhodnutí. Za účelem výběru nejvhodnějšího LLM pro tyto úlohy byla vytvořena vlastní metodika, pomocí níž byly vybrané LLM porovnány ve svých schopnostech odpovídat na otázky týkající se konkrétních soudních rozhodnutí. Metodika použila k tomuto porovnání jiné LLM, které fungovalo jako hodnotitel a pomocí dotazníkového šetření bylo zvalidováno, že toto automatické hodnocení je srovnatelné s hodnocením, které dávali skuteční uživatelé. Výstupem práce je již zmíněná Robojudge aplikace, která automaticky stahuje zveřejňovaná soudní rozhodnutí do vektorové databáze, díky které je možné rozhodnutí vyhledávat pomocí přirozeného jazyka. Rozhodnutí jsou získávána pomocí "stahovače", který se periodicky spouští, aby udržoval obsah databáze co nejaktuálnější. Vyhledaná rozhodnutí jsou prezentována jako krátká shrnutí vytvořená pomocí LLM. Uživatel má také možnost se rychle a jednoduše dotazovat na obsah konkrétního rozhodnutí, opět prostřednictvím přirozeného jazyka.cze
dc.description.abstractThe thesis explores how large language models (LLMs) can be used to analyze publically available court rulings of Czech civil courts. The main goal of the thesis was to make these rulings more accessible through the Robojudge web application which allows semantic search of the most similar rulings and presents them in an easy-to-understand way. To select the most appropriate LLM, a custom methodology was devised for comparing such models. This methodology involves evaluating responses from LLMs to legal questions by both human assessors and automatically through another model. Based on this methodology, the most suitable model was then selected. The outcome of the thesis is the aforementioned Robojudge web application that automatically retrieves publicly disclosed court rulings and stores them in a vector database, thus enabling the search of these rulings through natural language. The rulings are retrieved by a scraper that periodically runs itself to maintain the vector database up-to-date. Search results are then presented as concise summaries generated by an LLM. Additionally, users have the option to easily query the content of a specific court ruling, once again through natural language.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectvelký jazykový modelcze
dc.subjectLLMcze
dc.subjectGPT-4cze
dc.subjectvektorová databázecze
dc.subjectsoudní rozhodnutícze
dc.subjectscraping webucze
dc.subjectporovnání LLMcze
dc.subjectGPT-3cze
dc.subjectLlaMA 2cze
dc.subjectVicunacze
dc.subjectlarge language modeleng
dc.subjectLLMeng
dc.subjectGPT-4eng
dc.subjectvector databaseeng
dc.subjectcourt rulingeng
dc.subjectweb scrapingeng
dc.subjectLLM comparisoneng
dc.subjectGPT-3eng
dc.subjectLlaMA 2eng
dc.subjectVicunaeng
dc.titleRobojudge - analýza soudních rozhodnutícze
dc.titleRobojudge - analysis of court judgmentseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeŠimeček Ivan
theses.degree.disciplineUmělá inteligence 2021cze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatikacze


Files in this item




This item appears in the following Collection(s)

Show simple item record