Sumarizace propojených a otevřených dat
Summarizing Linked Open Data Datasets
Typ dokumentu
diplomová prácemaster thesis
Autor
Čabaiová Jana
Vedoucí práce
Dojčinovski Milan
Oponent práce
Klímek Jakub
Studijní obor
Webové a softwarové inženýrstvíStudijní program
InformatikaInstituce přidělující hodnost
katedra softwarového inženýrstvíObhájeno
2017-02-15Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Práce se zabývá studiem projektu Linked Open Data, jeho aktuálního stavu a také shrnutím jednotlivých sémantických technologii, jako je RDF model, dotazovací jazyk SPARQL, různé formáty datasetů a různé přístupy k jednotlivým datasetům. Součástí práce je také vývoj webové aplikace, který zahrnuje analýzu, návrh, implementaci a také testování dané aplikace. Hlavní metoda této aplikace má umožňovat výpočet sumarizace LOD datasetů na základě specifikovaných domén a entit, což znamená poměr zastoupení jednotlivých entit v doménách v rámci konkrétního datasetu. Hlavním výsledkem této práce je vytvořená a otestováná webová aplikace s výše zmíněnou implementovanou metodou na reálných datesetech DBpedia a GeoNames a také zpracování a porovnání jednotlivých výsledků. Tato aplikace by měla být užitečná zejména pro ty, kteří potřebují zjistit doménové zaměření jejich Linked Open Data datasetu nebo potřebují porovnat dva různé datasety na doménové úrovni. The work deals with the study of the project Linked Open Data, its current state and also with the overview of the particular semantic technologies. It is RDF model, query language SPARQL, different formats for RDF datasets and the different accesses to the particular datasets. Part of the work is also the development of the web application which contains analysis, design, implementation and testing of the particular application. The main method of this application should enable the calculation of the summarization of LOD datasets on the base of domain specification, which means calculation of domains and entities proportion in particular dataset. The main result of this work is created and tested web application with the above mentioned implemented method on the real datasets DBpedia a GeoNames and also the processing and comparing of the particular results. This application should be useful mainly for these, who need to find out domain representation of their Linked Open Data dataset or they need to compare domain representation of two different datasets.
Kolekce
- Diplomové práce - 18102 [1006]