Automata Approach to XML Data Indexing: Selecting Unknown Nodes

dc.contributor.advisor Šestáková, Eliška
dc.contributor.author Karzhenkova, Maria
dc.contributor.referee Pecka, Tomáš
dc.date.accepted 2018-06-18
dc.date.accessioned 2018-06-19T21:57:26Z
dc.date.available 2018-06-19T21:57:26Z
dc.date.issued 2018-06-13
dc.description.abstract Tato práce je součástí projektu "Indexování XML dokumentů pomocí automatů". Popisuje existující metody pro indexování XML dokumentů, které jsou založeny na teorii automatů, a jejich rozšíření, za účelem umožnění efektivního zpracování XPath dotazů skládajících se z libovolné kombinace child (/), descendant-or-self (//) os a asterisk (*) a nodename node testů, sloužících k navigaci v XML dokumentu. Ke konstrukci indexu pro daný XML dokument D s n elementy je využít odpovídající XML stromový model T. Zpracování dotazu Q o velikosti m proběhne v čase O(m) nezávislém na n. Tato práce obsahuje též diskuzi ohledně časové a paměťové složitosti pro každou z navržených metod. Všechny nově popsané algoritmy jsou implementovány a otestovány na reálních datech. cs
dc.description.abstract Being a part of the "Automata Approach to XML Data Indexing" project, this thesis is concerned with studying the existing methods of indexes creation algorithms based on the automata theory and extending them to deal with more significant fragment of XPath queries. The presented methods allow us to construct XML data indexes that support evaluation of all XPath queries using any combinations of child (/), descendant-or-self (//) axes, asterisk (*) and nodename node tests. Given an XML document D and its corresponding XML tree model T with n nodes, the tree is preprocessed and the index for the document D is constructed. The searching phase time of each of the constructed indexes for a query Q is bounded by O(m), where m is size of the query Q, and does not depend on the indexed XML document size n. Moreover, the space and time complexities for each of the proposed indexes are discussed, all the introduced algorithms are implemented and tested over the real-life datasets. en
dc.identifier KOS-695599707505
dc.identifier.uri http://hdl.handle.net/10467/76816
dc.language.iso ENG
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject XML,XPath,strom,konečný automat,index,neznámé uzly cs
dc.subject XML,XPath,tree,finite automaton,index,unknown nodes en
dc.title Indexování XML dokumentů pomocí automatů: výběr neznámých uzlů cs
dc.title Automata Approach to XML Data Indexing: Selecting Unknown Nodes en
dc.type bakalářská práce cs
dc.type bachelor thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication 237339ec-9c08-4fa8-9133-7f61a727de2f
relation.isAdvisorOfPublication.latestForDiscovery 237339ec-9c08-4fa8-9133-7f61a727de2f
relation.isAuthorOfPublication 9ddad046-ef27-476b-b177-5935eb274b67
relation.isAuthorOfPublication.latestForDiscovery 9ddad046-ef27-476b-b177-5935eb274b67
relation.isRefereeOfPublication 9f9fc22e-7dfb-4ea4-9470-644cc773fdfe
relation.isRefereeOfPublication.latestForDiscovery 9f9fc22e-7dfb-4ea4-9470-644cc773fdfe
theses.degree.discipline Teoretická informatika cs
theses.degree.grantor katedra teoretické informatiky cs
theses.degree.programme Informatika cs

Files

Original bundle

Now showing 1 - 3 of 3
Name:
F8-BP-2018-Karzhenkova-Maria-thesis.pdf
Size:
929.73 KB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT
Name:
F8-BP-2018-posudek-Sestakova_Eliska.pdf
Size:
138.48 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK
Name:
F8-BP-2018-posudek-Pecka_Tomas.pdf
Size:
142.2 KB
Format:
Adobe Portable Document Format
Description:
POSUDEK