Show simple item record

Relaxing Deductive and Inductive Reasoning in Relational Learning



dc.contributor.advisorKuželka Ondřej
dc.contributor.authorMartin Svatoš
dc.date.accessioned2024-03-20T14:19:14Z
dc.date.available2024-03-20T14:19:14Z
dc.date.issued2024-02-10
dc.identifierKOS-778758405905
dc.identifier.urihttp://hdl.handle.net/10467/114102
dc.description.abstractRelační učení využívá predikátovou logiku prvního řádu pro reprezentaci dat i modelů. Neoddiskutovatelnou výhodou tohoto formalismu je snadné vysvětlení naučených modelů a možnost reprezentovat širokou paletu problémů, kterými jsou například toxicita molekul nebo doplňování znalostní báze. Na druhou stranu, tento formalismus také přináší jistá úskalí a to zejména v případech aplikování predikátových logických hypotéz. Jejich samotné hledá je náročné kvůli velikému prostoru logických formulí, které plyne z predikátové logiky. Použití hypotéz ve formě predikátové logiky na reálných datech je těžký úkol sám o sobě, protože taková data často obsahují šum a vedou k ne zcela přesným hypotézám.Tato práce cílí na dva výše zmíněné problémy. Zaměřuje se na prořezávání prostoru sentencí ve dvou oddělených úlohách. Cílem první úlohy je generování celočíselných sekvencích, které mohou být popsány pomocí predikátové logiky. Naše výsledky ukazují, že námi navržený nový přístup řešení této úlohy, který připomíná relační dolování vzorů, funguje díky prořezávání prostoru logických formulí. Náš přístup zatím vygeneroval databází celočíselných sekvencí o velikosti jedné sedminy velice populární On-Line Encyclopedia of Integer Sequences (OEIS) a dokonce byl schopen vygenerovat sekvence, které již v této populární databázi jsou. Cílem druhé úlohy je prořezávání prostoru hypotéz v relačních doménách, pro což jsme vytvořili novou metodu, která využívá znalosti obsažené v datech, např. symetrii určitých relací. Pravdou je, že tato znalost musí být nejdříve naučena z dat, nicméně, naše experimenty ukázaly, že i tato část výpočtu je kompenzována efektivitou tohoto prořezávání, které je rychlejší a produkuje méně logických hypotéz aniž by došlo k ohrožení úplnosti prohledávaného prostoru. Posledním problémem, který v této práci řešíme, je použití nedokonalých hypotéz pro doplňování znalostní báze. Jejich přímočaré použití pomocí klasického odvozování z predikátové logiky prvního řádu je v tomto případě málo robustní. Proto jsme navrhli nové rozšíření metody založené na fragmentech dat, pro kterou jsme vyvinuli inferenční algoritmus. Naše rozšíření spočívá v prioritizaci pravidel, která se učíme pomocí heuristického shora-dolů paprskového prohledávání vyvinutého speciálně pro naší inferenční metodu. Experimenty ukazují, že naše inferenční metoda je v případě použití stejných pravidel lepší než ostatní inferenční metody a zároveň, ve spojení s heuristicky naučenými pravidly, je opatrnější než standardní pravidlové přístupy v indukčním nastavení.cze
dc.description.abstractRelational learning employs first-order logic for the representation of both data and models. The advantages of this representation arise from the transparent explainability of models and the ability to model a wide variety of tasks, including, for example, the well-known structural alert or knowledge base completion. However, it also poses some challenges when one wants to learn a model relying on an accurate hypothesis, which is quite a challenging problem since the space of hypotheses, i.e., logical formulae, is large and, in turn, makes the learning expensive. Utilizing learned hypotheses in a non-naive way is a challenging problem since learning on real-life data commonly leads to imperfect hypotheses.This thesis addresses these two challenges. Namely, we focus on pruning the space of logical sentences in two separate scenarios. Firstly, we study the problem of generating integer sequences that can be described using first-order logic. We show that our novel approach, which resembles relational pattern mining, is fruitful and scalable by pruning the space of logical formulae. Besides producing a database as large as one-seventh of the well-known On-Line Encyclopedia of Integer Sequences (OEIS), our approach was also able to generate new descriptions of several entries in OEIS. Secondly, we present a novel general technique for pruning hypotheses space by utilizing domain knowledge, which has to be learned at first and, hence, requires additional computational time. However, our experiments show that the method is faster than the standard isomorphism-based pruning and produces fewer hypotheses without sacrificing the completeness of the search. Finally, we consider the problem of utilizing imperfect rules for the knowledge base completion task, for which the standard entailment is too brittle. We propose a novel extension of an existing fragment-based inference algorithm by stratifying rules, which we learn using a heuristically driven top-down beam search suited for the inference algorithm. Our experiments show that the inference method is inferior to some others and, when accompanied by the heuristic rule learner, is more cautious than standard rule-based approaches applied in the inductive setting.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectrelační učenícze
dc.subjectmatematické objevycze
dc.subjectučení pravidelcze
dc.subjectprořezávání prostoru sekvencícze
dc.subjectinferencecze
dc.subjectrelational learningeng
dc.subjectmathematical discoveryeng
dc.subjectrule learningeng
dc.subjectsentenceeng
dc.subjectspace pruningeng
dc.subjectinferenceeng
dc.titleRelace deduktivního a induktivního odvozování v relačním učenícze
dc.titleRelaxing Deductive and Inductive Reasoning in Relational Learningeng
dc.typedisertační prácecze
dc.typedoctoral thesiseng
dc.contributor.refereeMalerba Donato
theses.degree.disciplineInformatika a výpočetní technikacze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeElektrotechnika a informatikacze


Files in this item


This item appears in the following Collection(s)

Show simple item record