Získávání znalostí z multimediálního obsahu

Petr Pulc

Knowledge Extraction from Multimedia Content

dc.contributor.advisor	Holeňa Martin
dc.contributor.author	Petr Pulc
dc.date.accessioned	2022-10-14T13:19:19Z
dc.date.available	2022-10-14T13:19:19Z
dc.date.issued	2022-08-31
dc.identifier	KOS-588127912305
dc.identifier.uri	http://hdl.handle.net/10467/104475
dc.description.abstract	Kdo, co, kde, kdy, jak a proč? Záznam odpovědí na tyto základní otázky dokáže objasnit okolnosti děje v reálném světě. V případě fotografií, nebo obrazového záznamu ale dokážeme na tyto otázky odpovědět jen velmi obecně, pokud neznáme kontext, nebo záznam nevyvolá přímou vzpomínku. Naopak při sestavování narativu z jednotlivých audiovizuálních klipů potřebujeme mít odpovědi na tyto otázky k dispozici, a následně je také předat divákovi ve srozumitelné formě. Jenže velmi často strojově čitelné informace obsahující odpovědi alespoň na část těchto otázek chybí. Z toho důvodu se metody automatického získávání znalostí z obrazových dat, pomáhajících poskytnout některé odpovědi, staly zásadní motivací pro tuto práci. Celou situaci navíc značně komplikuje to, že multimédia jsou značně rozmanitou doménou. V jednom audiovizuálním projektu se může snadno mísit několik typů obsahu, kdy každý vyžaduje jiné metody zpracování. Za tímto účelem jsme tak navrhli teoretický systém využívající principy meta-učení. Jako jeden ze základních kamenů pak uvažujeme metodu rozpoznání scény, na základě jejiž znalosti bychom dokázali lépe vybrat navazující metody zpracování. Ani tento problém však nemá triviální řešení a tak navrhujeme další pokročilé metody vedoucí až k problému sledování objektů ve scéně; metody, jejiž urychlení a zpřesnění by následně pomohlo nejen rozpoznávání scény ale také pro zvýšení výkonu metod, které by popisovaly samotné objekty ve scéně.	cze
dc.description.abstract	Who, what, where, when, how, and why? Recording the answers to these basic questions can shed light on the circumstances of real-world events. However, in the case of photos or video recordings, we can only answer these questions vaguely unless we know the context or it triggers a direct memory. On the other hand, when constructing a narrative from individual audiovisual clips, we need to have the answers to these questions available to convey them to the viewer in an understandable form. Yet, the machine-readable information containing answers to at least some of these questions is commonly missing. For this reason, methods for automatic knowledge extraction from image data that provide some of the answers have become a significant motivation for this dissertation thesis. The whole situation is further complicated because multimedia is a highly diverse domain. Several types of content can easily be mixed in a single audiovisual project, each requiring different processing methods. To this end, we propose a theoretical system that uses meta-learning principles. We then consider scene recognition as one of the cornerstone methods, allowing us to select better downstream processing methods. However, even this problem does not have a trivial solution, and so we propose additional advanced methods leading up to the problem of tracking objects in the scene; methods whose speed-up and refinement would subsequently help not only the scene recognition but also increase the performance of methods that describe objects in the scene.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	Zpracování obrazu	cze
dc.subject	Kombinace klasifikačních metod	cze
dc.subject	Metaučení	cze
dc.subject	Hledání struktury v datech	cze
dc.subject	Rozpoznávání scény	cze
dc.subject	Sledování objektů	cze
dc.subject	Image processing	eng
dc.subject	Classificationcombiner	eng
dc.subject	Metalearning	eng
dc.subject	Datastructure discovery	eng
dc.subject	Scene recognition	eng
dc.subject	Visual object tracking	eng
dc.title	Získávání znalostí z multimediálního obsahu	cze
dc.title	Knowledge Extraction from Multimedia Content	eng
dc.type	disertační práce	cze
dc.type	doctoral thesis	eng
dc.contributor.referee	Perfiljeva Irina
theses.degree.discipline	Informatika	cze
theses.degree.grantor	katedra aplikované matematiky	cze
theses.degree.programme	Informatika	cze

Soubory tohoto záznamu

Název:: F8-D-2022-Pulc-Petr-dissertation ...
Velikost:: 9.789Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Disertační práce - 18000 [50]

Zobrazit minimální záznam