Algoritmy pro extrakci definic v právních předpisech
Algorithms for extraction of definitions in laws
dc.contributor.advisor | Křemen Petr | |
dc.contributor.author | Jan Hošťálek | |
dc.date.accessioned | 2024-06-19T09:57:01Z | |
dc.date.available | 2024-06-19T09:57:01Z | |
dc.date.issued | 2024-06-18 | |
dc.identifier | KOS-1243608744605 | |
dc.identifier.uri | http://hdl.handle.net/10467/115750 | |
dc.description.abstract | Tato práce představuje inovativní algoritmy a přístupy pro extrakci definic z českých legislativních dokumentů s využitím technologií sémantického webu a velkých jazykových modelů. Zaměřuje se na použitelnost jazykových modelů pro úlohy extrakce termínů, definic termínů a následné tvorby ontologií. Z metodologického hlediska zahrnuje techniky jako In Context Learning a Retrieval Augmented Generation, které vedou ke zlepšení extrakce a interpretace právní terminologie. Výsledky obsahují důležité poznatky o použitelnosti jazykových modelů pro konkrétní NLP úlohy v oblasti analýzy a zpracování právních dokumentů, které souvisejí s tvorbou znalostních ontologií. | cze |
dc.description.abstract | This work presents new algorithms and approaches for extracting definitions from Czech legislation documents using advanced Semantic Web technologies and Large Language Models. It focuses on the applicability of language models to the tasks of term extraction, term definitions and subsequent ontology creation. From a methodological perspective, it includes techniques such as In Context Learning and Retrieval Augmented Generation, leading to improved extraction and interpretation of legal terminology. The findings offer important insights into the applicability of language models to specific NLP tasks in the area of legal document analysis and processing, which is related to the creation of knowledge ontologies. | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | extrakce termínů | cze |
dc.subject | extrakce definic | cze |
dc.subject | tvorba ontologií | cze |
dc.subject | NLP | cze |
dc.subject | LLM | cze |
dc.subject | Few Shot RAG | cze |
dc.subject | Embeddings | cze |
dc.subject | ICL | cze |
dc.subject | Term Extraction | eng |
dc.subject | Definition Extraction | eng |
dc.subject | Ontology Creation | eng |
dc.subject | NLP | eng |
dc.subject | LLM | eng |
dc.subject | Few Shot RAG | eng |
dc.subject | Embeddings | eng |
dc.subject | ICL | eng |
dc.title | Algoritmy pro extrakci definic v právních předpisech | cze |
dc.title | Algorithms for extraction of definitions in laws | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.contributor.referee | Klíma Karel | |
theses.degree.discipline | Datové vědy | cze |
theses.degree.grantor | katedra počítačů | cze |
theses.degree.programme | Otevřená informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 13136 [892]