Zobrazit minimální záznam

Detection of Objects of Interest in Large Dynamic Sets of Data



dc.contributor.advisorMatas Jiří
dc.contributor.authorFraněk Aleš
dc.date.accessioned2015-03-16T15:32:21Z
dc.date.available2015-03-16T15:32:21Z
dc.identifierKOS-532563283005
dc.identifier.urihttp://hdl.handle.net/10467/61149
dc.description.abstractSociální media se stala nedílnou součástí životů lidí. Lidé je používají, aby vyjádřili svoje pocitiy a názory. Pro merketéry je důležité, aby zde sledovali povědomí o své značce. Zatímco analýza přirozeného jazyka je zde hojně používaná, automatická interpretace sdílených obrázků se teprve ujímá. Sociální média jsou díky svému obrovskému objemu dat specifická oblast, která vyžaduje nová unikátní řešení.Navrhujeme novou kompetní metodu pro vyhledávání obrazu a rozpoznávání log. Kladli jsme důraz na vysokou přesnost algoritmu a na jeho rychlost. Abychom toho dosáhli, použili jsme nejmodernější metody. Použili jsme ORB detektor, FREAK deskriptor, vyhledávací algoritmus Multi-probe LSH a RANSAC pro finální verifikaci. Mimo to jsme také představili vlastní zlepšení vyhledávacího procesu ? rychlou metodu pro lepší distribuci bodů zájmu v obrázku, vzájemná verifikace a filtrace bodů zájmu mezi trénovacími daty nebo série testů, které dokáží odhallit špatné hypotézy prostorové transformace aniž by se musela počítat jejich plná podpora.Algoritmus jsme úspěšně naimplementovali a vyhodnotili ho na dvou datasetech. První je standardní dataset pro rozpoznávání log. Skládá se z 32 tříd log stažených ze služby Flickr. Druhý dataset obsahuje 5 milionů obrázů ze sociální sítě Twitter. Jeden z našich přínosů je právě vytvoření tohoto datasetu a poskytnutí ho k dalšímu výzkumu.Náš algoritmus dokázal na datech z Flickeru nalézt 47% skutečných log bez falešné detekce. Pro data z Twitteru našel 18% vyskytujících se log s 1% nesprávně označených obrázků.cze
dc.description.abstractSocial media have become a part of peoples? lives. People use it to express their feelings and their preferences. It is important for marketers to monitor sentiment around their brands. While the automatic textual analysis is widely used, some interpretation of shared images is still at its beginning. Social media are a specific domain because the amount of shared data huge and they require unique solutions.We propose a new end-to-end method for image retrieval for logo recognition. We put emphasis on near perfect precision and short query time. In order to satisfy these requirements, we use state-of-the-art feature based methods. We use ORB detector, FREAK descriptor, Multi-probe LSH matching algorithm and RANSAC for verification. We also introduce our own improvements to the process like fast non-maxima suppression, mutual keypoint verification among the training images or tests which allow RANSAC to decline wrong hypotheses before computing their support.We have implemented functional program which was evaluated on two datasets. The first one is a standard dataset for logo recognition. It consist of 32 logotype classes downloaded from photo sharing service Flickr. The second one is our dataset of 5 million images downloaded from Twitter. One of our contributions is making this dataset and providing it for the future research.Our algorithm works with 100% precision and 47% recall for the Flickr dataset and with 99% precision and 18% recall for the Twitter dataset.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfeng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://www.cvut.cz/sites/default/files/content/d1dc93cd-5894-4521-b799-c7e715d3c59e/cs/20160901-metodicky-pokyn-c-12009-o-dodrzovani-etickych-principu-pri-priprave-vysokoskolskych.pdfcze
dc.subjectpočítačové vidění, vzhledávání obrázků, obrazové oblasti zájmucze
dc.titleDetekce objektů zájmu ve velkých dynamických souborech datcze
dc.titleDetection of Objects of Interest in Large Dynamic Sets of Dataeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.date.accepted2015-01-20
dc.contributor.refereeUrban Martin
theses.degree.disciplineUmělá inteligencecze
theses.degree.grantorkatedra počítačůcze
theses.degree.programmeOtevřená informatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam