Automatické učení ontologií ze semistrukturovaných dat
Automatic ontology learning from semi-structured data
dc.contributor.advisor | Šedivý Jan | |
dc.contributor.author | Masri Filip | |
dc.date.accessioned | 2017-06-07T16:13:24Z | |
dc.date.available | 2017-06-07T16:13:24Z | |
dc.date.issued | 2017-05-09 | |
dc.identifier | KOS-695599654805 | |
dc.identifier.uri | http://hdl.handle.net/10467/70147 | |
dc.description.abstract | Používání ontologií pro zachycení znalostí není žádnou novinkou. Důkazem tomu jsou veřejně dostupné ontologie, například z iniciativy Schema.org, které se hojně používají pro anotování webové obsahu. Ovšem, tyto ontologie bývají příliš obecné. Proto je potřeba systémů, které by generovaly ontologie zaměřené na specifičtější domény typu Mobilní telefony. Takové ontologie by poté mohly sloužit k rozšiřování obecnějších ontologií, jako je právě Schema.org. Zde by mohla pomoci tato práce, která se zameřuje na vytváření ontologií z <table> elementů obsažených ve webových stránkách. Implementovaný systém využívá metody pro klasifikaci typu tabulky, detekci hlavičky, porozumění vztahům mezi buňkami v tabulce a vytváření finální ontologie v RDF/OWL formátu. Výsledný přístup byl úspěšně aplikován na doménu mobilních telefonů. Jednotlivé ontologie byly vygenerovány z tabulek nalezených na stránkách \newline amazon.com, buymobiles.net, gadgets.ndtv.com a snapdeal.com. Kromě této domény se daný systém dá využít i na další domény jako např. kamery, firmy, auta, basketbalový hráči. | cze |
dc.description.abstract | Publicly available ontologies, such as Schema.org, tend to be quite general. Therefore, demand for systems automatically generating domain specific ontologies has arose. The generated ontologies could later extend the general ones, for example in Schema.org. This thesis focuses on building ontologies from <table> elements found in WEB pages. Methods were implemented for table type classification, header location, table understanding and creating final ontologies in RDF/OWL. The implemented system has been successfully applied to mobile phones domain. Ontologies were generated from tables found on amazon.com, buymobiles.net, gadgets.ndtv.com and snapdeal.com. Moreover, the system is applicable to other domains, such as cameras, companies, cars and basketball players. | eng |
dc.language.iso | ENG | |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | Ontologie, Znalostní databáze, Vytěžování vztahů z tabulek | cze |
dc.subject | Ontologies, Knowledge databases, Table understanding | eng |
dc.title | Automatické učení ontologií ze semistrukturovaných dat | cze |
dc.title | Automatic ontology learning from semi-structured data | eng |
dc.type | diplomová práce | cze |
dc.type | master thesis | eng |
dc.date.accepted | ||
dc.contributor.referee | Kordík Pavel | |
theses.degree.discipline | Znalostní inženýrství | cze |
theses.degree.grantor | katedra teoretické informatiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Diplomové práce - 18101 [216]