Robojudge - analysis of court judgments

dc.contributor.advisor Szabó, Adam
dc.contributor.author Řehounek, Miroslav
dc.contributor.referee Šimeček, Ivan
dc.date.accessioned 2024-06-20T22:52:11Z
dc.date.available 2024-06-20T22:52:11Z
dc.date.issued 2024-06-20
dc.description.abstract Práce se zabývá způsoby využití velkých jazykových modelů (large language model, LLM) k analýze veřejně dostupných rozhodnutí českých soudů. Hlavním cílem práce bylo lépe zpřístupnit tato rozhodnutí, a to vytvořením webové aplikace Robojudge, která umožní v databázi zveřejněných rozhodnutí vyhledávat pomocí nového typu uživatelského rozhraní využívajícího ve svém základu LLM k sémantickému vyhledávání, shrnování a odpovídání na otázky týkající se jednotlivých rozhodnutí. Za účelem výběru nejvhodnějšího LLM pro tyto úlohy byla vytvořena vlastní metodika, pomocí níž byly vybrané LLM porovnány ve svých schopnostech odpovídat na otázky týkající se konkrétních soudních rozhodnutí. Metodika použila k tomuto porovnání jiné LLM, které fungovalo jako hodnotitel a pomocí dotazníkového šetření bylo zvalidováno, že toto automatické hodnocení je srovnatelné s hodnocením, které dávali skuteční uživatelé. Výstupem práce je již zmíněná Robojudge aplikace, která automaticky stahuje zveřejňovaná soudní rozhodnutí do vektorové databáze, díky které je možné rozhodnutí vyhledávat pomocí přirozeného jazyka. Rozhodnutí jsou získávána pomocí "stahovače", který se periodicky spouští, aby udržoval obsah databáze co nejaktuálnější. Vyhledaná rozhodnutí jsou prezentována jako krátká shrnutí vytvořená pomocí LLM. Uživatel má také možnost se rychle a jednoduše dotazovat na obsah konkrétního rozhodnutí, opět prostřednictvím přirozeného jazyka. cs
dc.description.abstract The thesis explores how large language models (LLMs) can be used to analyze publically available court rulings of Czech civil courts. The main goal of the thesis was to make these rulings more accessible through the Robojudge web application which allows semantic search of the most similar rulings and presents them in an easy-to-understand way. To select the most appropriate LLM, a custom methodology was devised for comparing such models. This methodology involves evaluating responses from LLMs to legal questions by both human assessors and automatically through another model. Based on this methodology, the most suitable model was then selected. The outcome of the thesis is the aforementioned Robojudge web application that automatically retrieves publicly disclosed court rulings and stores them in a vector database, thus enabling the search of these rulings through natural language. The rulings are retrieved by a scraper that periodically runs itself to maintain the vector database up-to-date. Search results are then presented as concise summaries generated by an LLM. Additionally, users have the option to easily query the content of a specific court ruling, once again through natural language. en
dc.identifier KOS-1240469314305
dc.identifier.uri http://hdl.handle.net/10467/115968
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject velký jazykový model cs
dc.subject LLM cs
dc.subject GPT-4 cs
dc.subject vektorová databáze cs
dc.subject soudní rozhodnutí cs
dc.subject scraping webu cs
dc.subject porovnání LLM cs
dc.subject GPT-3 cs
dc.subject LlaMA 2 cs
dc.subject Vicuna cs
dc.subject large language model en
dc.subject LLM en
dc.subject GPT-4 en
dc.subject vector database en
dc.subject court ruling en
dc.subject web scraping en
dc.subject LLM comparison en
dc.subject GPT-3 en
dc.subject LlaMA 2 en
dc.subject Vicuna en
dc.title Robojudge - analýza soudních rozhodnutí cs
dc.title Robojudge - analysis of court judgments en
dc.type bakalářská práce cs
dc.type bachelor thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication be97ea4a-a461-4842-b017-f8a2d941f636
relation.isAdvisorOfPublication.latestForDiscovery be97ea4a-a461-4842-b017-f8a2d941f636
relation.isAuthorOfPublication 76d23083-d150-4122-9538-037cef70af10
relation.isAuthorOfPublication.latestForDiscovery 76d23083-d150-4122-9538-037cef70af10
relation.isRefereeOfPublication 3b0dc36e-4d0b-4b35-8756-3f7675ba4a55
relation.isRefereeOfPublication.latestForDiscovery 3b0dc36e-4d0b-4b35-8756-3f7675ba4a55
theses.degree.discipline Umělá inteligence 2021 cs
theses.degree.grantor katedra aplikované matematiky cs
theses.degree.programme Informatika cs

Files

Original bundle

Now showing 1 - 3 of 3
Name:
F8-BP-2024-Rehounek-Miroslav-thesis.pdf
Size:
2.72 MB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT
Name:
F8-BP-2024-posudek-Szabo_Adam.pdf
Size:
44.98 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK
Name:
F8-BP-2024-posudek-Simecek_Ivan.pdf
Size:
41.44 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK