Zobrazit minimální záznam

Detection and Localization of Texture-less Objects with Deep Neural Networks



dc.contributor.advisorHodaň Tomáš
dc.contributor.authorHaluza Pavel
dc.date.accessioned2017-06-07T13:21:07Z
dc.date.available2017-06-07T13:21:07Z
dc.date.issued2017-05-26
dc.identifierKOS-587865096605
dc.identifier.urihttp://hdl.handle.net/10467/68552
dc.description.abstractTato práce zkoumá Faster R-CNN, moderní metodu pro detekci objektů v RGB snímcích, a navrhuje její rozšíření na RGB-D snímky. Jsou diskutována a vyhodnocena řešení následujících problémů: vyplnění chybějících hodnot v hloubkových snímcích, zakódování hloubkové informace (původní vs. povrchové normály), rozšíření CNN architektury o hloubkové vstupy a inicializace vah v rozšířené síti. Celkově nejlepších výsledků bylo dosaženo se síti pracující s informací o hloubce předzpracované iterativním mediánovým filtrem pro vyplnění chybějících hodnot a hloubkovými váhami v první konvoluční vrstvě inicializovanými průměrem RGB vah předtrénovaných na ImageNetu. Nicméně zlepšení vůči původní metodě využívající pouze RGB kanály je nepatrné (mAP bylo zvýšeno o 1 - 2 %), což vybízí k jinému přístupu použití hloubkové informace.cze
dc.description.abstractThis thesis studies Faster R-CNN, the state-of-art method for object detection in RGB images, and proposes its extension to RGB-D images. Solutions to the following problems are proposed and evaluated: filling missing values in depth images, depth encoding (raw depth vs. surface normals), extension of the CNN architecture to accept the extra depth information, and initialization of weights in the extended network. The overall best results were achieved with a network that accepts an extra depth channel, pre-processed by the iterative median filter to fill in the missing values, and has the depth weights in the first convolutional layer initialized with the mean of the color weights that were pretrained on ImageNet. However, the improvement over the original method using only RGB channels is not significant (mAP was increased by 1 - 2 %), which suggests a need for different incorporation of the depth information.eng
dc.language.isoENG
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectdetekce objektu, bez textury, RGB-D, CNN, hluboké učenícze
dc.subjectobject detection, texture-less, RGB-D, CNN, deep learningeng
dc.titleDetekce a lokalizace netexturovaných objektů pomocí hlubokých neuronových sítícze
dc.titleDetection and Localization of Texture-less Objects with Deep Neural Networkseng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.date.accepted2017-06-19
dc.contributor.refereeKämäräinen Joni
theses.degree.disciplineRobotikacze
theses.degree.grantorkatedra kybernetikycze
theses.degree.programmeKybernetika a robotikacze


Soubory tohoto záznamu







Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam