Anotovaná databáze obrázků tváří lidí z Wikipedie
Wikipeople
Autoři
Školitelé
Oponenti
Editoři
Další přispěvatelé
Název časopisu
ISSN časopisu
Název svazku
Vydavatel
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Datum obhajoby
Abstrakt
V této práci představujeme metodu a skripty určené k automatickému stahování a zpracování osobních stránek z Wikipedie. S neustále se rozvíjející oblastí strojového učení a počítačové vize stoupá zájem o anotované databáze obrázků tváří. Účelem této práce je vývoj nástrojů pro tvorbu přesně takové databáze. Anotace obrázků spočívá v dodatečných informacích k obrázku, které popisují jeho určité atributy. Čtenáři jsou vysvětleny principy fungování Wikipedie, Wikidata a dalších souvisejících projektů spolu s jejich vzájemnými vztahy. Práce vysvětluje použitou metodu i implementační detaily vytvořených skriptů. V neposlední řádě jsou skripty testovány na množině stránek, která byla rovněž manuálně anotována za účelem zjišení přesnosti výsledků.
In this thesis we present the method and scripts intended for automatic downloading and processing of personal homepages from Wikipedia. With the fields of machine learning and computer vision constantly developing, the demand for annotated databases of facial images rises. The goal of this work is the development of tools for creating such databases. The image annotation is a set additional information describing specific attributes in said image. The reader is introduced to principals and function of Wikipedia, Wikidata and other relevant projects together with their mutual relationship. The thesis explains used method and implementation details of created scripts. Last but not least, the scripts are tested on a set of pages, which have been manually annotated in order to determine the result precision.
In this thesis we present the method and scripts intended for automatic downloading and processing of personal homepages from Wikipedia. With the fields of machine learning and computer vision constantly developing, the demand for annotated databases of facial images rises. The goal of this work is the development of tools for creating such databases. The image annotation is a set additional information describing specific attributes in said image. The reader is introduced to principals and function of Wikipedia, Wikidata and other relevant projects together with their mutual relationship. The thesis explains used method and implementation details of created scripts. Last but not least, the scripts are tested on a set of pages, which have been manually annotated in order to determine the result precision.
Popis
Citace
Odkaz na sadu výzkumných dat
Trvalý odkaz
Práva/Licence
A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.
Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění.