Large Language Models for Numerical Queries
Velké jazykové modely pro numerické dotazy
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
Tato práce zkoumá rozlišné metody využívající generace kódu k řešení matematických slovních úloh. Prezentuje nový formát využívající symbolických výrazů a přepisuje existující datasety do tohoto formátu. Následně trénuje model k používání tohoto formátu a vyhodnocuje jeho výsledky a provádí experimenty s různými metodami, které slouží k zlepšení výkonu.
This thesis examines various methods that use code generation as a means of solving mathematical word problems. It presents a novel format that uses sym- bolic expressions and reformats existing datasets into the proposed format. It then trains a model that uses this format and evaluates its results, experimenting with various methods to improve its per- formance.
This thesis examines various methods that use code generation as a means of solving mathematical word problems. It presents a novel format that uses sym- bolic expressions and reformats existing datasets into the proposed format. It then trains a model that uses this format and evaluates its results, experimenting with various methods to improve its per- formance.