Hluboká neuronová sít pro mapování města s využitím dat z Google Street View

Varun Burde

Deep neural network for city mapping using Google Street View data

dc.contributor.advisor	Reinštein Michal
dc.contributor.author	Varun Burde
dc.date.accessioned	2020-01-28T23:51:51Z
dc.date.available	2020-01-28T23:51:51Z
dc.date.issued	2020-01-28
dc.identifier	KOS-989037132805
dc.identifier.uri	http://hdl.handle.net/10467/86098
dc.description.abstract	S rozvojem výpočetní síly a rozsáhlýmidatovými soubory vede masivní zlepšeníhluboké neuronové sítě k mnoha rozšíře-ným aplikacím. Jednou z aplikací hlubokéneuronové sítě je řešení problémů počíta-čového vidění, jako je klasifikace a segmen-tace. Soutěž jako ImageNet Výzva provizuální rozpoznávání ve velkém měřítku posunula schopnost na další úroveň;v některých případech je klasifikace lepšínež lidská.Tato práce je příkladem aplikace vyu-žívající schopnost neuronových sítí. Do-kument popisuje implementaci, metodiku,experimenty prováděné pro vývoj softwa-rových řešení pomocí hluboké neuronovésítě na obrázkových prostředcích z ob-rázků Google Street View .Uživatel poskytuje soubor geojson se-stávající z oblasti zájmu ve tvaru čtvercenebo mnohoúhelníku jako vstup. GoogleStreetView API stáhne dostupné ob-rázky. Snímky jsou nejprve zpracoványpomocí nejmodernějších CNN (Mask R-CNN), aby detekovaly objekty, kla-sifikovaly je pomocí skóre spolehlivosti,vytvořily ohraničující rámeček a kolemdetekovaného objektu malovaly pixely. .Textový soubor ukládá informace, jakojsou souřadnice ohraničovacího rámečku,název třídy a hodnoty masky.Obyčejný RGB (panoramatický) sní-mek z GSV neobsahuje žádné hloubkovéúdaje. Obrázky jsou zpracovávány s jinýmnejmodernějším CNN (monodepth2),aby se odhadla hloubka objektů v obra-zech po pixelech.Průměrná hodnota hloubky v masce sepoužívá jako vzdálenost objektu. Souřad-nice ohraničovacího rámečku se používajípro umístění objektu v jiných osách.Výsledné výstupy jsou markery deteko-vaných objektů, které jsou základem mapy.Sloupcový graf pro vizualizaci počtu de-tekcí ve třídě. Textový soubor obsahujícípočet detekcí pro každou třídu. Výstupz každého kroku zpracování výše, jakojsou detekce, hloubkové obrázky, hodnotymasky pro porovnání a vyhodnocení.	cze
dc.description.abstract	With the advancement of computation power and large datasets, a massive improvement of the deep neural network leads to many widespread applications. One of the applications of the deep neural network is solving computer vision problems like classification and segmentation.Competition like ImageNet Large Scale Visual Recognition Challenge, took the capability to the next level; in some cases, classification is better than human. This thesis is an example of an application that utilizes the ability of neural networks. The document describes the implementation, methodology, experiments done for developing software solutions by using the deep neural network on image resources form Google Street View images. The user provides a geojson file consists of an area of interest in the form of square or polygon as the input. Google StreetView API downloads the available images. The images are first processed with the state of the art CNN (Mask R-CNN) to detect the objects, classify them with the confidence score, generate a bounding box, and a pixel-wise mask around the detected object. The text file stores information like coordinates of the bounding box, name of the class, and the mask values. An ordinary RGB ( panoramic ) image from GSV does not consist of any depth data. The images are processed with another state of art CNN (monodepth2), to estimate the pixel-wise depth of the objects in the images. The averaged value of the depth within the mask is used as the distance of the object. The coordinates of the bounding box are used for positioning of the object in other axes. The resulting outputs are markers of detected objects underlying in the map. A bar graph to visualize the number of detection per class. A text file containing the number of detection per each class. The output from each processing step above, like detections, depth images, mask values to compare and evaluate.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	Google Street View	cze
dc.subject	Maska R-CNN	cze
dc.subject	Monodepth2	cze
dc.subject	Detekce objektů	cze
dc.subject	Mapy Google	cze
dc.subject	Hluboká neuronová síť	cze
dc.subject	Mapování města	cze
dc.subject	Google Street View	eng
dc.subject	Mask R-CNN	eng
dc.subject	Monodepth2	eng
dc.subject	Object detection	eng
dc.subject	Google maps	eng
dc.subject	Deep neural network	eng
dc.subject	City mapping	eng
dc.title	Hluboká neuronová sít pro mapování města s využitím dat z Google Street View	cze
dc.title	Deep neural network for city mapping using Google Street View data	eng
dc.type	diplomová práce	cze
dc.type	master thesis	eng
dc.contributor.referee	Kubelka Vladimír
theses.degree.discipline	Kybernetika a robotika	cze
theses.degree.grantor	katedra řídicí techniky	cze
theses.degree.programme	Kybernetika a robotika	cze

Soubory tohoto záznamu

Název:: F3-DP-2020-Burde-Varun-Final_r ...
Velikost:: 12.12Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Název:: F3-DP-2020-Burde-Varun-priloha ...
Velikost:: 208.0Kb
Formát:: PDF
Popis:: PRILOHA
: Zobrazit/otevřít

Název:: F3-DP-2020-posudek-Kubelka_Vla ...
Velikost:: 81.36Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Název:: F3-DP-2020-posudek-Reinstein_M ...
Velikost:: 238.5Kb
Formát:: PDF
Popis:: POSUDEK
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Diplomové práce - 13135 [327]

Zobrazit minimální záznam

Hluboká neuronová sít pro mapování města s využitím dat z Google Street View

Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Související záznamy

Možnosti využití cloudového řešení Google Apps pro podporu firemních činností ﻿

Nákup produktů pomocí Google Assistant ﻿

On-line marketing pro zprostředkování služeb ﻿

Možnosti využití cloudového řešení Google Apps pro podporu firemních činností

Nákup produktů pomocí Google Assistant

On-line marketing pro zprostředkování služeb