Konfigurovatelný nástroj pro tvorbu syntetických dat
Configurable tool for synthetic data creation
Typ dokumentu
diplomová prácemaster thesis
Autor
Tomáš Bubeníček
Vedoucí práce
Bittner Jiří
Oponent práce
Neoral Michal
Studijní obor
Počítačová grafikaStudijní program
Otevřená informatikaInstituce přidělující hodnost
katedra počítačové grafiky a interakcePráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Při vyhodnocování funkcionality algoritmů z oboru počítačového vidění či při trénování nových algoritmů za pomocí metody strojového učení, velké množství algoritmů obsahujících dodatečné ground truth výstupy, které reprezentují ideální výsledek daných algoritmů. V této práci jsme analyzovali existující datatové sady určené pro počítačové vidění. Zkoumali jsme, jak jsou taková data získávána jak ve skutečném světě, tak pomocí simulací. Navrhli jsme nástroj na zjednodušení tvorby syntetických dat tohoto typu a naimplementovali jsme ho jako rozšíření editoru Unity. Naše implementace je schopná využít texturované 3D modely a na jejich základě generovat mimo jiné informaci o povrchových normálách, hloubkových mapách, sémantické segmentace, optického toku a pohybových maskách. S využitím našeho nástroje jsme vygenerovali tři ukázkové datové sady. When evaluating existing computer vision algorithms or training new machine learning algorithms, large datasets of various images with ground truth, the ideal known solution to the currently solved problem, need to be acquired. We review existing real-life datasets containing ground truth, which are used in computer vision, and explore how they were acquired. We then recount different synthetic datasets, and survey the different ways such data can be calculated. We propose a tool to simplify generation of such data, and implement such tool as an extension of the Unity editor. Our implementation is able to use textured 3D models to generate image sequences with additional labeling, such as surface normals, depth map, object segmentation, optical flow, motion segmentation among others. We use the tool to create a set of three example datasets.
Kolekce
- Diplomové práce - 13139 [396]