Vývoj modelu strojového vidění pro detekci hráčů stolního tenisu
Computer vision model for table tennis player detection
Typ dokumentu
bakalářská prácebachelor thesis
Autor
Yannick Daniel Gibson
Vedoucí práce
Klouda Karel
Oponent práce
Friedjungová Magda
Studijní obor
Umělá inteligence 2021Studijní program
InformatikaInstituce přidělující hodnost
katedra aplikované matematikyPráva
A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmlVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html
Metadata
Zobrazit celý záznamAbstrakt
Tato bakalářská práce se zaměřuje na detekci objektů v pingpongovém zápase. Mezi tyto objekty patří pingpongové pálky a hráči. Dále jsme se v zápasech rozhodli detekovat míček a zapisovatele skóre. Pro detekci objektů jsme využili programovací jazyk Python s architekturou YOLOv8 (You Only Look Once verze 8) vycházející z YOLOv5 architektury. Tento projekt získá vstupní video, nakreslí ohraničující rámečky kolem objektů zájmu a zobrazí video s predikcemi. Získáváme neoznačená data a anotujeme je ručně, ale zároveň využíváme metodu pre-annotation s naším natrénovaným modelem. Kromě toho jsme vytvořili množství technik manipulace s daty a analýzu našich výsledků. Výsledkem je robustní model detekující všechny čtyři definované třídy při rychlosti 72 snímků za sekundu (FPS). This bachelor's thesis focuses on identifying specific targets in a ping-pong match. Among these targets are ping-pong paddles and players. Furthermore, we also decided to detect a ball and a scorekeeper in matches. We applied a computer vision system in the ubiquitous Python programming language for object detection with the architecture YOLOv8 (You Only Look Once version 8) based on YOLOv5 paper. This project gets a video input, draws the enclosing bounding boxes around objects of interest, and displays the video with predictions. We acquire unlabeled data and annotate it manually while also utilizing the pre-annotation method with a pre-trained model. In addition, we supply a plethora of data manipulation techniques and analysis of our results. We end with a robust model detecting all four defined classes at the inference speed of 72 Frames Per Second (FPS).
Kolekce
- Bakalářské práce - 18105 [292]