Hashování obrázků vlakových vozů pomocí hlubokých neuronových sítí
Train Car Image Hashing Using Deep Networks
Typ dokumentu
diplomová prácemaster thesis
Autor
Konstantin Khokhlov
Vedoucí práce
Pacovský Ondřej
Oponent práce
Zimmermann Karel
Studijní obor
Kybernetika a robotikaStudijní program
Kybernetika a robotikaInstituce přidělující hodnost
katedra kybernetikyObhájeno
2023-02-01Práva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Cílem této práce je vytvořit systém reprezentující obrazy vlakových vozů pomocí sémantických hash kódů. Tyto kódy lze použít k porovnávání snímků stejných vozů zachycených z různých míst a v různé časy. Studie začíná zkoumáním existujících algoritmů v reprezentaci obrazu. Práce se zaměřuje na 2-stupňovou metodu založenou na CNN, ve které se nejprve naučí spojitá reprezentace obrazu a poté se pomocí natrénované hashovací vrstvy převede do binární podoby. Vlastní datové sady pro řízené učení byly shromážděny bez lidské anotace. V rámci testování práce porovnává několik architektur integrovaných neuronových sítí, hašovací metody a nastavení učení z hlediska jejich přesnosti, obsazené paměti a rychlosti. Dále práce hodnotí silné a slabé stránky navrhované metody a zkoumá rozdíly mezi spojitou a binární reprezentací obrazu. Výsledky tohoto projektu ukazují, že navrhovaná metoda dosahuje vysokého výkonu na shromážděných souborech dat a lze ji aplikovat v reálném průmyslovém systému. This thesis aims to create a system representing train car images using semantic hash codes. These codes can be used to match images of the same cars captured from different locations and times. The study begins by examining existing algorithms in image representation. The work focuses on the 2-staged CNN-based method, in which a continuous representation of the images is learned first and then transformed into a binary form using a trained hashing layer. The custom datasets for supervised learning were collected without human annotation. Within the testing, the work compares several integrated neural network architectures, hashing methods, and learning settings in terms of their search-based accuracy, memory footprint, and inference speed. It also evaluates the strengths and weaknesses of the proposed method and examines the differences between continuous and binary image representation. The results of this project show that the proposed method achieves high performance on the collected datasets and can be applied in a real industrial system.
Kolekce
- Diplomové práce - 13133 [474]