Využití LLM modelů pro zkoumání vlastností léčiv

Sára Dobiášová

Use of Large Language Models for the Study of Drug Properties

dc.contributor.advisor	Ryšavý Petr
dc.contributor.author	Sára Dobiášová
dc.date.accessioned	2025-06-14T00:04:16Z
dc.date.available	2025-06-14T00:04:16Z
dc.date.issued	2025-06-13
dc.identifier	KOS-1240737300005
dc.identifier.uri	http://hdl.handle.net/10467/123504
dc.description.abstract	Velké jazykové modely (LLM modely) nabízejí efektivní způsob zpracovávání textu. V této práci ukážeme možná využití těchto modelů ve farmaceutickém odvětví. Nejprve poskytneme stručný přehled historie zpracování přirozeného jazyka, vysvětlíme klíčové koncepty LLM modelů a porovnáme některé populární modely. Dále představíme klíčové otázky týkající se lékových letáků a popíšeme současná řešení se zaměřením na LLM modely. Na základě metod popsaných ve studii PharmBERT natrénujeme vlastní model specializovaný na farmaceutický jazyk a ukážeme, jak si vede na úloze extrakce interakcí léčiv. Výsledky porovnáme s dalšími BERT modely (BERT, BioBERT, ClinicalBERT), abychom posoudili přínos doménově specifického trénování a zaměnitelnost našeho modelu s ostatními. Výsledky také porovnáme s těmi z původní studie. Nakonec natrénujeme samostatný model na datech z evropských lékových letáků a pokusíme se zjistit, zda je rozdíl mezi farmaceutickým jazykem používaným v evropských a amerických letácích.	cze
dc.description.abstract	Large language models (LLMs) provide an efficient way of processing text. This work will demonstrate how LLMs can be utilised within the pharmaceutical industry. First, we will provide an overview of the history of natural language processing, explain the key concepts behind LLMs, and compare some of the most popular models. Next, we will present the key problems of drug labelling and describe current solutions, focusing on LLMs. Based on the methods described in PharmBERT, we will train a model specialised for pharmaceutical language and show how it performs in the drug-drug interaction extraction task. We will compare its performance with other BERT-based models (BERT, BioBERT, ClinicalBERT) to assess the benefits of domain-specific training and the substitutability of our model with others. We will also compare our results to the original work. Finally, we will train a separate version of the model on data from EU drug labels and determine whether there is any difference between the language used in the EU and the US drug labels.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	velké jazykové modely	cze
dc.subject	interakce léčiv	cze
dc.subject	transformer	cze
dc.subject	přenosové učení	cze
dc.subject	klasifikace vztahů	cze
dc.subject	large language models	eng
dc.subject	drug-drug interactions	eng
dc.subject	transformer	eng
dc.subject	transfer learning	eng
dc.subject	relationship classification	eng
dc.title	Využití LLM modelů pro zkoumání vlastností léčiv	cze
dc.title	Use of Large Language Models for the Study of Drug Properties	eng
dc.type	bakalářská práce	cze
dc.type	bachelor thesis	eng
dc.contributor.referee	Ullrich Herbert
theses.degree.discipline	Základy umělé inteligence a počítačových věd	cze
theses.degree.grantor	katedra kybernetiky	cze
theses.degree.programme	Otevřená informatika	cze

Soubory tohoto záznamu

Název:: F3-BP-2025-Dobiasova-Sara-dobi ...
Velikost:: 1.002Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-BP-2025-Dobiasova-Sara-pril ...
Velikost:: 22.79Kb
Formát:: Neznámý
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-BP-2025-posudek-Ullrich_Her ...
Velikost:: 262.6Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-BP-2025-posudek-Rysavy_Petr.pdf
Velikost:: 208.5Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Bakalářské práce - 13133 [851]

Zobrazit minimální záznam