Vývoj modelu strojového vidění pro detekci hráčů stolního tenisu
Computer vision model for table tennis player detection
dc.contributor.advisor | Klouda Karel | |
dc.contributor.author | Yannick Daniel Gibson | |
dc.date.accessioned | 2024-06-19T09:54:59Z | |
dc.date.available | 2024-06-19T09:54:59Z | |
dc.date.issued | 2024-06-15 | |
dc.identifier | KOS-1240814627305 | |
dc.identifier.uri | http://hdl.handle.net/10467/115709 | |
dc.description.abstract | Tato bakalářská práce se zaměřuje na detekci objektů v pingpongovém zápase. Mezi tyto objekty patří pingpongové pálky a hráči. Dále jsme se v zápasech rozhodli detekovat míček a zapisovatele skóre. Pro detekci objektů jsme využili programovací jazyk Python s architekturou YOLOv8 (You Only Look Once verze 8) vycházející z YOLOv5 architektury. Tento projekt získá vstupní video, nakreslí ohraničující rámečky kolem objektů zájmu a zobrazí video s predikcemi. Získáváme neoznačená data a anotujeme je ručně, ale zároveň využíváme metodu pre-annotation s naším natrénovaným modelem. Kromě toho jsme vytvořili množství technik manipulace s daty a analýzu našich výsledků. Výsledkem je robustní model detekující všechny čtyři definované třídy při rychlosti 72 snímků za sekundu (FPS). | cze |
dc.description.abstract | This bachelor's thesis focuses on identifying specific targets in a ping-pong match. Among these targets are ping-pong paddles and players. Furthermore, we also decided to detect a ball and a scorekeeper in matches. We applied a computer vision system in the ubiquitous Python programming language for object detection with the architecture YOLOv8 (You Only Look Once version 8) based on YOLOv5 paper. This project gets a video input, draws the enclosing bounding boxes around objects of interest, and displays the video with predictions. We acquire unlabeled data and annotate it manually while also utilizing the pre-annotation method with a pre-trained model. In addition, we supply a plethora of data manipulation techniques and analysis of our results. We end with a robust model detecting all four defined classes at the inference speed of 72 Frames Per Second (FPS). | eng |
dc.publisher | České vysoké učení technické v Praze. Vypočetní a informační centrum. | cze |
dc.publisher | Czech Technical University in Prague. Computing and Information Centre. | eng |
dc.rights | A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html | eng |
dc.rights | Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html | cze |
dc.subject | detekce objektů | cze |
dc.subject | YOLO | cze |
dc.subject | ping pong | cze |
dc.subject | fine-tuning | cze |
dc.subject | hluboké učení | cze |
dc.subject | Python | cze |
dc.subject | object detection | eng |
dc.subject | YOLO | eng |
dc.subject | ping-pong | eng |
dc.subject | fine-tuning | eng |
dc.subject | deep learning | eng |
dc.subject | Python | eng |
dc.title | Vývoj modelu strojového vidění pro detekci hráčů stolního tenisu | cze |
dc.title | Computer vision model for table tennis player detection | eng |
dc.type | bakalářská práce | cze |
dc.type | bachelor thesis | eng |
dc.contributor.referee | Friedjungová Magda | |
theses.degree.discipline | Umělá inteligence 2021 | cze |
theses.degree.grantor | katedra aplikované matematiky | cze |
theses.degree.programme | Informatika | cze |
Soubory tohoto záznamu
Tento záznam se objevuje v následujících kolekcích
-
Bakalářské práce - 18105 [292]