Detekce objektů zájmu ve velkých dynamických souborech dat

Franěk Aleš

Detection of Objects of Interest in Large Dynamic Sets of Data

dc.contributor.advisor	Matas Jiří
dc.contributor.author	Franěk Aleš
dc.date.accessioned	2015-03-16T15:32:21Z
dc.date.available	2015-03-16T15:32:21Z
dc.identifier	KOS-532563283005
dc.identifier.uri	http://hdl.handle.net/10467/61149
dc.description.abstract	Sociální media se stala nedílnou součástí životů lidí. Lidé je používají, aby vyjádřili svoje pocitiy a názory. Pro merketéry je důležité, aby zde sledovali povědomí o své značce. Zatímco analýza přirozeného jazyka je zde hojně používaná, automatická interpretace sdílených obrázků se teprve ujímá. Sociální média jsou díky svému obrovskému objemu dat specifická oblast, která vyžaduje nová unikátní řešení.Navrhujeme novou kompetní metodu pro vyhledávání obrazu a rozpoznávání log. Kladli jsme důraz na vysokou přesnost algoritmu a na jeho rychlost. Abychom toho dosáhli, použili jsme nejmodernější metody. Použili jsme ORB detektor, FREAK deskriptor, vyhledávací algoritmus Multi-probe LSH a RANSAC pro finální verifikaci. Mimo to jsme také představili vlastní zlepšení vyhledávacího procesu ? rychlou metodu pro lepší distribuci bodů zájmu v obrázku, vzájemná verifikace a filtrace bodů zájmu mezi trénovacími daty nebo série testů, které dokáží odhallit špatné hypotézy prostorové transformace aniž by se musela počítat jejich plná podpora.Algoritmus jsme úspěšně naimplementovali a vyhodnotili ho na dvou datasetech. První je standardní dataset pro rozpoznávání log. Skládá se z 32 tříd log stažených ze služby Flickr. Druhý dataset obsahuje 5 milionů obrázů ze sociální sítě Twitter. Jeden z našich přínosů je právě vytvoření tohoto datasetu a poskytnutí ho k dalšímu výzkumu.Náš algoritmus dokázal na datech z Flickeru nalézt 47% skutečných log bez falešné detekce. Pro data z Twitteru našel 18% vyskytujících se log s 1% nesprávně označených obrázků.	cze
dc.description.abstract	Social media have become a part of peoples? lives. People use it to express their feelings and their preferences. It is important for marketers to monitor sentiment around their brands. While the automatic textual analysis is widely used, some interpretation of shared images is still at its beginning. Social media are a specific domain because the amount of shared data huge and they require unique solutions.We propose a new end-to-end method for image retrieval for logo recognition. We put emphasis on near perfect precision and short query time. In order to satisfy these requirements, we use state-of-the-art feature based methods. We use ORB detector, FREAK descriptor, Multi-probe LSH matching algorithm and RANSAC for verification. We also introduce our own improvements to the process like fast non-maxima suppression, mutual keypoint verification among the training images or tests which allow RANSAC to decline wrong hypotheses before computing their support.We have implemented functional program which was evaluated on two datasets. The first one is a standard dataset for logo recognition. It consist of 32 logotype classes downloaded from photo sharing service Flickr. The second one is our dataset of 5 million images downloaded from Twitter. One of our contributions is making this dataset and providing it for the future research.Our algorithm works with 100% precision and 47% recall for the Flickr dataset and with 99% precision and 18% recall for the Twitter dataset.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf	cze
dc.subject	počítačové vidění, vzhledávání obrázků, obrazové oblasti zájmu	cze
dc.title	Detekce objektů zájmu ve velkých dynamických souborech dat	cze
dc.title	Detection of Objects of Interest in Large Dynamic Sets of Data	eng
dc.type	diplomová práce	cze
dc.type	master thesis	eng
dc.date.accepted	2015-01-20
dc.contributor.referee	Urban Martin
theses.degree.discipline	Umělá inteligence	cze
theses.degree.grantor	katedra počítačů	cze
theses.degree.programme	Otevřená informatika	cze

Soubory tohoto záznamu

Název:: F3-DP-2015-Franek-Ales-Detekce ...
Velikost:: 12.81Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-DP-2014-posudek-Urban_Martin.pdf
Velikost:: 136.6Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-DP-2014-posudek-Matas_Jiri.pdf
Velikost:: 185.1Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Diplomové práce - 13136 [833]

Zobrazit minimální záznam