Zobrazit minimální záznam

Knowledge Extraction from Multimedia Content



dc.contributor.advisorHoleňa Martin
dc.contributor.authorPetr Pulc
dc.date.accessioned2022-10-14T13:19:19Z
dc.date.available2022-10-14T13:19:19Z
dc.date.issued2022-08-31
dc.identifierKOS-588127912305
dc.identifier.urihttp://hdl.handle.net/10467/104475
dc.description.abstractKdo, co, kde, kdy, jak a proč? Záznam odpovědí na tyto základní otázky dokáže objasnit okolnosti děje v reálném světě. V případě fotografií, nebo obrazového záznamu ale dokážeme na tyto otázky odpovědět jen velmi obecně, pokud neznáme kontext, nebo záznam nevyvolá přímou vzpomínku. Naopak při sestavování narativu z jednotlivých audiovizuálních klipů potřebujeme mít odpovědi na tyto otázky k dispozici, a následně je také předat divákovi ve srozumitelné formě. Jenže velmi často strojově čitelné informace obsahující odpovědi alespoň na část těchto otázek chybí. Z toho důvodu se metody automatického získávání znalostí z obrazových dat, pomáhajících poskytnout některé odpovědi, staly zásadní motivací pro tuto práci. Celou situaci navíc značně komplikuje to, že multimédia jsou značně rozmanitou doménou. V jednom audiovizuálním projektu se může snadno mísit několik typů obsahu, kdy každý vyžaduje jiné metody zpracování. Za tímto účelem jsme tak navrhli teoretický systém využívající principy meta-učení. Jako jeden ze základních kamenů pak uvažujeme metodu rozpoznání scény, na základě jejiž znalosti bychom dokázali lépe vybrat navazující metody zpracování. Ani tento problém však nemá triviální řešení a tak navrhujeme další pokročilé metody vedoucí až k problému sledování objektů ve scéně; metody, jejiž urychlení a zpřesnění by následně pomohlo nejen rozpoznávání scény ale také pro zvýšení výkonu metod, které by popisovaly samotné objekty ve scéně.cze
dc.description.abstractWho, what, where, when, how, and why? Recording the answers to these basic questions can shed light on the circumstances of real-world events. However, in the case of photos or video recordings, we can only answer these questions vaguely unless we know the context or it triggers a direct memory. On the other hand, when constructing a narrative from individual audiovisual clips, we need to have the answers to these questions available to convey them to the viewer in an understandable form. Yet, the machine-readable information containing answers to at least some of these questions is commonly missing. For this reason, methods for automatic knowledge extraction from image data that provide some of the answers have become a significant motivation for this dissertation thesis. The whole situation is further complicated because multimedia is a highly diverse domain. Several types of content can easily be mixed in a single audiovisual project, each requiring different processing methods. To this end, we propose a theoretical system that uses meta-learning principles. We then consider scene recognition as one of the cornerstone methods, allowing us to select better downstream processing methods. However, even this problem does not have a trivial solution, and so we propose additional advanced methods leading up to the problem of tracking objects in the scene; methods whose speed-up and refinement would subsequently help not only the scene recognition but also increase the performance of methods that describe objects in the scene.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectZpracování obrazucze
dc.subjectKombinace klasifikačních metodcze
dc.subjectMetaučenícze
dc.subjectHledání struktury v datechcze
dc.subjectRozpoznávání scénycze
dc.subjectSledování objektůcze
dc.subjectImage processingeng
dc.subjectClassificationcombinereng
dc.subjectMetalearningeng
dc.subjectDatastructure discoveryeng
dc.subjectScene recognitioneng
dc.subjectVisual object trackingeng
dc.titleZískávání znalostí z multimediálního obsahucze
dc.titleKnowledge Extraction from Multimedia Contenteng
dc.typedisertační prácecze
dc.typedoctoral thesiseng
dc.contributor.refereePerfiljeva Irina
theses.degree.disciplineInformatikacze
theses.degree.grantorkatedra aplikované matematikycze
theses.degree.programmeInformatikacze


Soubory tohoto záznamu


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam