Sociopath: automatická extrakce informací o kulturních událostech
Sociopath: Automatic Local Events Extractor
Typ dokumentu
diplomová prácemaster thesis
Autor
Alperovich Galina
Vedoucí práce
Drchal Jan
Oponent práce
Šourek Gustav
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
The Internet is large data source which is mostly unstructured from the semantic point of view. Despite the fact there are many attempts to unify the way how information is presented, there is still no general format for it. For the computer program, it is easy to read the Web page as HTML code, but it's hard to understand the meaning and extract the semantic structure. It makes the automatic information extraction be the challenging problem. Automatic extraction of the information from Web pages is a common task in data mining. It is used in many modern services and strongly related to the structure of the webpage and the properties of the content itself. The thesis is focused on Web information extraction about local social events. Social events include various cultural events, sports events, and any other activities. One of the biggest problems in Web Extraction field is collecting the training data. In this thesis, we presented the approach with the use of Microdata semantic markup for automatic collecting the labeled training dataset. We built the system which automatically collects the training samples with comprehensive features including visual, textual, spatial and DOM-related. Also, this thesis is focused on various techniques on data processing, cleaning and building the classification model for every extracted event component. The Internet is large data source which is mostly unstructured from the semantic point of view. Despite the fact there are many attempts to unify the way how information is presented, there is still no general format for it. For the computer program, it is easy to read the Web page as HTML code, but it's hard to understand the meaning and extract the semantic structure. It makes the automatic information extraction be the challenging problem. Automatic extraction of the information from Web pages is a common task in data mining. It is used in many modern services and strongly related to the structure of the webpage and the properties of the content itself. The thesis is focused on Web information extraction about local social events. Social events include various cultural events, sports events, and any other activities. One of the biggest problems in Web Extraction field is collecting the training data. In this thesis, we presented the approach with the use of Microdata semantic markup for automatic collecting the labeled training dataset. We built the system which automatically collects the training samples with comprehensive features including visual, textual, spatial and DOM-related. Also, this thesis is focused on various techniques on data processing, cleaning and building the classification model for every extracted event component.
Kolekce
- Diplomové práce - 13136 [833]
Související záznamy
Zobrazují se záznamy příbuzné na základě názvu, autora a předmětu.
-
Studie k prostorové struktuře projektu Radlická radiála
Autor: Jelínek Marek; Vedoucí práce: Šulc Rostislav; Oponent práce: Kutálek Jan
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2018-01-03)Srovnání variant logistického sytému odvozu rubaniny ze stavby na skládku pro uložení rubaniny. Specifikace jednotlivých variant z hlediska prostorového, technologického a časového. Prostorové řešení nakládky a vykládky ... -
Vyhodnocení přesnosti extrakce 3D pozice kojenců z RGB obrázků pomocí RGB-D kamer a systému sledování pohybu
Autor: Noemi Vaculínová; Vedoucí práce: Hoffmann Matěj; Oponent práce: Hesse Nikolas
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2023-06-08)Analýza pohybu kojenců je důležitá při diagnostice motorických a kognitivních vývojových poruch, jako je například dětská mozková obrna. Automatizovaná extrakce pohybu kojenců z RGB videí by mohla usnadnit včasnou a vzdálenou ... -
Katarakta - přehled operačních technik
Autor: Zollerová Monika; Vedoucí práce: Brůnová Blanka; Oponent práce: Pitrová Šárka
(České vysoké učení technické v Praze. Vypočetní a informační centrum.Czech Technical University in Prague. Computing and Information Centre., 2016-05-20)Cílem této práce je porovnání operačních technik používaných v kataraktové chirurgii. Práce začíná reklinací, která byla první metodou odstranění zakalené čočky, přes intrakapsulární extrakci a extrakapsulární extrakci. ...