Zobrazit minimální záznam

Computer vision model for table tennis player detection



dc.contributor.advisorKlouda Karel
dc.contributor.authorYannick Daniel Gibson
dc.date.accessioned2024-06-19T09:54:59Z
dc.date.available2024-06-19T09:54:59Z
dc.date.issued2024-06-15
dc.identifierKOS-1240814627305
dc.identifier.urihttp://hdl.handle.net/10467/115709
dc.description.abstractTato bakalářská práce se zaměřuje na detekci objektů v pingpongovém zápase. Mezi tyto objekty patří pingpongové pálky a hráči. Dále jsme se v zápasech rozhodli detekovat míček a zapisovatele skóre. Pro detekci objektů jsme využili programovací jazyk Python s architekturou YOLOv8 (You Only Look Once verze 8) vycházející z YOLOv5 architektury. Tento projekt získá vstupní video, nakreslí ohraničující rámečky kolem objektů zájmu a zobrazí video s predikcemi. Získáváme neoznačená data a anotujeme je ručně, ale zároveň využíváme metodu pre-annotation s naším natrénovaným modelem. Kromě toho jsme vytvořili množství technik manipulace s daty a analýzu našich výsledků. Výsledkem je robustní model detekující všechny čtyři definované třídy při rychlosti 72 snímků za sekundu (FPS).cze
dc.description.abstractThis bachelor's thesis focuses on identifying specific targets in a ping-pong match. Among these targets are ping-pong paddles and players. Furthermore, we also decided to detect a ball and a scorekeeper in matches. We applied a computer vision system in the ubiquitous Python programming language for object detection with the architecture YOLOv8 (You Only Look Once version 8) based on YOLOv5 paper. This project gets a video input, draws the enclosing bounding boxes around objects of interest, and displays the video with predictions. We acquire unlabeled data and annotate it manually while also utilizing the pre-annotation method with a pre-trained model. In addition, we supply a plethora of data manipulation techniques and analysis of our results. We end with a robust model detecting all four defined classes at the inference speed of 72 Frames Per Second (FPS).eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectdetekce objektůcze
dc.subjectYOLOcze
dc.subjectping pongcze
dc.subjectfine-tuningcze
dc.subjecthluboké učenícze
dc.subjectPythoncze
dc.subjectobject detectioneng
dc.subjectYOLOeng
dc.subjectping-pongeng
dc.subjectfine-tuningeng
dc.subjectdeep learningeng
dc.subjectPythoneng
dc.titleVývoj modelu strojového vidění pro detekci hráčů stolního tenisucze
dc.titleComputer vision model for table tennis player detectioneng
dc.typebakalářská prácecze
dc.typebachelor thesiseng
dc.contributor.refereeFriedjungová Magda
theses.degree.disciplineUmělá inteligence 2021cze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu




Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam