Sumarizace propojených a otevřených dat
Summarizing Linked Open Data Datasets
Type of document
diplomová prácemaster thesis
Author
Čabaiová Jana
Supervisor
Dojčinovski Milan
Opponent
Klímek Jakub
Field of study
Webové a softwarové inženýrstvíStudy program
InformatikaInstitutions assigning rank
katedra softwarového inženýrstvíDefended
2017-02-15Rights
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Show full item recordAbstract
Práce se zabývá studiem projektu Linked Open Data, jeho aktuálního stavu a také shrnutím jednotlivých sémantických technologii, jako je RDF model, dotazovací jazyk SPARQL, různé formáty datasetů a různé přístupy k jednotlivým datasetům. Součástí práce je také vývoj webové aplikace, který zahrnuje analýzu, návrh, implementaci a také testování dané aplikace. Hlavní metoda této aplikace má umožňovat výpočet sumarizace LOD datasetů na základě specifikovaných domén a entit, což znamená poměr zastoupení jednotlivých entit v doménách v rámci konkrétního datasetu. Hlavním výsledkem této práce je vytvořená a otestováná webová aplikace s výše zmíněnou implementovanou metodou na reálných datesetech DBpedia a GeoNames a také zpracování a porovnání jednotlivých výsledků. Tato aplikace by měla být užitečná zejména pro ty, kteří potřebují zjistit doménové zaměření jejich Linked Open Data datasetu nebo potřebují porovnat dva různé datasety na doménové úrovni. The work deals with the study of the project Linked Open Data, its current state and also with the overview of the particular semantic technologies. It is RDF model, query language SPARQL, different formats for RDF datasets and the different accesses to the particular datasets. Part of the work is also the development of the web application which contains analysis, design, implementation and testing of the particular application. The main method of this application should enable the calculation of the summarization of LOD datasets on the base of domain specification, which means calculation of domains and entities proportion in particular dataset. The main result of this work is created and tested web application with the above mentioned implemented method on the real datasets DBpedia a GeoNames and also the processing and comparing of the particular results. This application should be useful mainly for these, who need to find out domain representation of their Linked Open Data dataset or they need to compare domain representation of two different datasets.
Collections
- Diplomové práce - 18102 [942]