Show simple item record

Deep neural network for city mapping using Google Street View data



dc.contributor.advisorReinštein Michal
dc.contributor.authorVarun Burde
dc.date.accessioned2020-01-28T23:51:51Z
dc.date.available2020-01-28T23:51:51Z
dc.date.issued2020-01-28
dc.identifierKOS-989037132805
dc.identifier.urihttp://hdl.handle.net/10467/86098
dc.description.abstractS rozvojem výpočetní síly a rozsáhlýmidatovými soubory vede masivní zlepšeníhluboké neuronové sítě k mnoha rozšíře-ným aplikacím. Jednou z aplikací hlubokéneuronové sítě je řešení problémů počíta-čového vidění, jako je klasifikace a segmen-tace. Soutěž jako ImageNet Výzva provizuální rozpoznávání ve velkém měřítku posunula schopnost na další úroveň;v některých případech je klasifikace lepšínež lidská.Tato práce je příkladem aplikace vyu-žívající schopnost neuronových sítí. Do-kument popisuje implementaci, metodiku,experimenty prováděné pro vývoj softwa-rových řešení pomocí hluboké neuronovésítě na obrázkových prostředcích z ob-rázků Google Street View .Uživatel poskytuje soubor geojson se-stávající z oblasti zájmu ve tvaru čtvercenebo mnohoúhelníku jako vstup. GoogleStreetView API stáhne dostupné ob-rázky. Snímky jsou nejprve zpracoványpomocí nejmodernějších CNN (Mask R-CNN), aby detekovaly objekty, kla-sifikovaly je pomocí skóre spolehlivosti,vytvořily ohraničující rámeček a kolemdetekovaného objektu malovaly pixely. .Textový soubor ukládá informace, jakojsou souřadnice ohraničovacího rámečku,název třídy a hodnoty masky.Obyčejný RGB (panoramatický) sní-mek z GSV neobsahuje žádné hloubkovéúdaje. Obrázky jsou zpracovávány s jinýmnejmodernějším CNN (monodepth2),aby se odhadla hloubka objektů v obra-zech po pixelech.Průměrná hodnota hloubky v masce sepoužívá jako vzdálenost objektu. Souřad-nice ohraničovacího rámečku se používajípro umístění objektu v jiných osách.Výsledné výstupy jsou markery deteko-vaných objektů, které jsou základem mapy.Sloupcový graf pro vizualizaci počtu de-tekcí ve třídě. Textový soubor obsahujícípočet detekcí pro každou třídu. Výstupz každého kroku zpracování výše, jakojsou detekce, hloubkové obrázky, hodnotymasky pro porovnání a vyhodnocení.cze
dc.description.abstractWith the advancement of computation power and large datasets, a massive improvement of the deep neural network leads to many widespread applications. One of the applications of the deep neural network is solving computer vision problems like classification and segmentation.Competition like ImageNet Large Scale Visual Recognition Challenge, took the capability to the next level; in some cases, classification is better than human. This thesis is an example of an application that utilizes the ability of neural networks. The document describes the implementation, methodology, experiments done for developing software solutions by using the deep neural network on image resources form Google Street View images. The user provides a geojson file consists of an area of interest in the form of square or polygon as the input. Google StreetView API downloads the available images. The images are first processed with the state of the art CNN (Mask R-CNN) to detect the objects, classify them with the confidence score, generate a bounding box, and a pixel-wise mask around the detected object. The text file stores information like coordinates of the bounding box, name of the class, and the mask values. An ordinary RGB ( panoramic ) image from GSV does not consist of any depth data. The images are processed with another state of art CNN (monodepth2), to estimate the pixel-wise depth of the objects in the images. The averaged value of the depth within the mask is used as the distance of the object. The coordinates of the bounding box are used for positioning of the object in other axes. The resulting outputs are markers of detected objects underlying in the map. A bar graph to visualize the number of detection per class. A text file containing the number of detection per each class. The output from each processing step above, like detections, depth images, mask values to compare and evaluate.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectGoogle Street Viewcze
dc.subjectMaska R-CNNcze
dc.subjectMonodepth2cze
dc.subjectDetekce objektůcze
dc.subjectMapy Googlecze
dc.subjectHluboká neuronová síťcze
dc.subjectMapování městacze
dc.subjectGoogle Street Vieweng
dc.subjectMask R-CNNeng
dc.subjectMonodepth2eng
dc.subjectObject detectioneng
dc.subjectGoogle mapseng
dc.subjectDeep neural networkeng
dc.subjectCity mappingeng
dc.titleHluboká neuronová sít pro mapování města s využitím dat z Google Street Viewcze
dc.titleDeep neural network for city mapping using Google Street View dataeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.contributor.refereeKubelka Vladimír
theses.degree.disciplineKybernetika a robotikacze
theses.degree.grantorkatedra řídicí technikycze
theses.degree.programmeKybernetika a robotikacze


Files in this item





This item appears in the following Collection(s)

Show simple item record