Show simple item record

Vehicle Detection and Pose Estimation for Autonomous Driving



dc.contributor.advisorMatas Jiří
dc.contributor.authorNovák Libor
dc.date.accessioned2017-06-07T13:21:51Z
dc.date.available2017-06-07T13:21:51Z
dc.date.issued2017-05-24
dc.identifierKOS-587865268405
dc.identifier.urihttp://hdl.handle.net/10467/68586
dc.description.abstractTato diplomová práce představuje plně konvoluční síť pro detekci 2D a 3D bounding boxů aut z obrázků, se speciálním zaměřením na využití v autonomním řízení vozidel. Oproti předcházejícím metodám, které používají neuronové sítě pro detekci 3D bouniding boxů, síť představená v této práci je trénovatelná tzv. end-to-end a umí detekovat objekty v různých velikostech během jediného zpracování. Je uvedena nová reprezentace 3D bounding boxů, která je nezávislá na matici kamery (kameře použité pro snímání obrázků). Tato vlastnost umožňuje, aby byl detektor trénován na několika různých datasetech najednou a zároveň mohl detekovat 3D bounding boxy na úplně jiných datasetech, než byl trénován. Prezentovaná síť dokáže zpracovávat 0.5 MPx obrázky z KITTI datasetu v rychlosti 10 snímků za sekundu, což je přibližně o řád rychleji, než nejrychlejší síť, která má lepší výsledky detekce. Z tohoto důvodu může být aplikovaná v autonomním řízení.cze
dc.description.abstractThe thesis presents a fully convolutional neural network for 2D and 3D bounding box detection of cars from monocular images intended for autonomous driving applications. In contrast with previous deep neural network methods applied to 3D bounding box detection, the introduced network is end-to-end trainable and detects objects at multiple scales in a single pass. We introduce a novel 3D bounding box representation, which is independent of the image projection matrix (camera used to take the images). Therefore, the detector may be trained on several different datasets at a time and also detect 3D bounding boxes on completely different datasets than it was trained on. The presented multi-scale end-to-end network is capable of processing 0.5MPx KITTI images in 10fps, which makes it about an order of magnitude faster than the closest competitor that has superior detection results. Therefore, it is possible to be used in autonomous driving scenarios.eng
dc.language.isoENG
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectdetekce automobilů, neuronové sítě, strojové učení, zpracování obrazucze
dc.subjectcar detection, 3D bounding box, deep neural networks, deep learning, machine learning, image processingeng
dc.titleDetekce 3D objektů pro systémy řízení autonomního vozidlacze
dc.titleVehicle Detection and Pose Estimation for Autonomous Drivingeng
dc.typediplomová prácecze
dc.typemaster thesiseng
dc.date.accepted2017-06-12
dc.contributor.refereeMatoušek Martin
theses.degree.disciplinePočítačové vidění a digitální obrazcze
theses.degree.grantorkatedra kybernetikycze
theses.degree.programmeOtevřená informatikacze


Files in this item






This item appears in the following Collection(s)

Show simple item record