Detekce objektů zájmu ve velkých dynamických souborech dat
Detection of Objects of Interest in Large Dynamic Sets of Data
Typ dokumentu
diplomová prácemaster thesis
Autor
Franěk Aleš
Vedoucí práce
Matas Jiří
Oponent práce
Urban Martin
Studijní obor
Umělá inteligenceStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačůObhájeno
2015-01-20Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdf
Metadata
Zobrazit celý záznamAbstrakt
Sociální media se stala nedílnou součástí životů lidí. Lidé je používají, aby vyjádřili svoje pocitiy a názory. Pro merketéry je důležité, aby zde sledovali povědomí o své značce. Zatímco analýza přirozeného jazyka je zde hojně používaná, automatická interpretace sdílených obrázků se teprve ujímá. Sociální média jsou díky svému obrovskému objemu dat specifická oblast, která vyžaduje nová unikátní řešení.Navrhujeme novou kompetní metodu pro vyhledávání obrazu a rozpoznávání log. Kladli jsme důraz na vysokou přesnost algoritmu a na jeho rychlost. Abychom toho dosáhli, použili jsme nejmodernější metody. Použili jsme ORB detektor, FREAK deskriptor, vyhledávací algoritmus Multi-probe LSH a RANSAC pro finální verifikaci. Mimo to jsme také představili vlastní zlepšení vyhledávacího procesu ? rychlou metodu pro lepší distribuci bodů zájmu v obrázku, vzájemná verifikace a filtrace bodů zájmu mezi trénovacími daty nebo série testů, které dokáží odhallit špatné hypotézy prostorové transformace aniž by se musela počítat jejich plná podpora.Algoritmus jsme úspěšně naimplementovali a vyhodnotili ho na dvou datasetech. První je standardní dataset pro rozpoznávání log. Skládá se z 32 tříd log stažených ze služby Flickr. Druhý dataset obsahuje 5 milionů obrázů ze sociální sítě Twitter. Jeden z našich přínosů je právě vytvoření tohoto datasetu a poskytnutí ho k dalšímu výzkumu.Náš algoritmus dokázal na datech z Flickeru nalézt 47% skutečných log bez falešné detekce. Pro data z Twitteru našel 18% vyskytujících se log s 1% nesprávně označených obrázků. Social media have become a part of peoples? lives. People use it to express their feelings and their preferences. It is important for marketers to monitor sentiment around their brands. While the automatic textual analysis is widely used, some interpretation of shared images is still at its beginning. Social media are a specific domain because the amount of shared data huge and they require unique solutions.We propose a new end-to-end method for image retrieval for logo recognition. We put emphasis on near perfect precision and short query time. In order to satisfy these requirements, we use state-of-the-art feature based methods. We use ORB detector, FREAK descriptor, Multi-probe LSH matching algorithm and RANSAC for verification. We also introduce our own improvements to the process like fast non-maxima suppression, mutual keypoint verification among the training images or tests which allow RANSAC to decline wrong hypotheses before computing their support.We have implemented functional program which was evaluated on two datasets. The first one is a standard dataset for logo recognition. It consist of 32 logotype classes downloaded from photo sharing service Flickr. The second one is our dataset of 5 million images downloaded from Twitter. One of our contributions is making this dataset and providing it for the future research.Our algorithm works with 100% precision and 47% recall for the Flickr dataset and with 99% precision and 18% recall for the Twitter dataset.
Kolekce
- Diplomové práce - 13136 [892]