Zobrazit minimální záznam

Learning peripersonal space representations: From brains to robots



dc.contributor.advisorSvoboda Tomáš
dc.contributor.authorZdeněk Straka
dc.date.accessioned2023-10-24T07:19:17Z
dc.date.available2023-10-24T07:19:17Z
dc.date.issued2023-09-11
dc.identifierKOS-778758401205
dc.identifier.urihttp://hdl.handle.net/10467/112296
dc.description.abstractPředpokládá se, že reprezentace prostoru v těsné blízkosti těla (peripersonální prostor -- PPP), významně přispívá k obrannému chování a tím i k přežití. Navzdory četným empirickým poznatkům o reprezentaci PPP u lidí i opic, zůstávají neurální mechanismy, které jsou základem těchto procesů, z velké části neznámé. V této práci se zabýváme především myšlenkou, že vizuálně-taktilní (nebo zvukově-taktilní) predikce -- vizuální (nebo zvukový) podnět se využije k předpovědi budoucího kontaktu s tělem vnímaného prostřednictvím dotyku -- je klíčovým mechanismem reprezentace PPP, jak naznačují první poznatky. Tento mechanismus jsme zkoumali pomocí výpočetních modelů. Začali jsme s hmatovou modalitou a vyvinuli jsme biologicky inspirovanou reprezentaci velkých ploch povrchu těla humanoidního robota. Reprezentace byla založena na modifikované neuronové síti samoorganizující se mapy, natrénované na taktilních datech z humanoidního robota, což umožnilo zahrnout předchozí znalosti o reprezentaci povrchu těla v primární somatosenzorické kůře. Tento výzkum byl využit ke zkoumání procesu tvorby této reprezentace. Následovaly modely provádějící vizuálně-taktilní predikci. První model využíval architekturu neuronové sítě, která kombinovala omezený Boltzmannův stroj pro integraci polohy a rychlosti s dopřednou neuronovou sítí pro předpovídání budoucího kontaktu s tělem. Model prokázal proveditelnost vizuálně-taktilní predikce replikováním jevu expanze PPP, ke kterému dochází s rostoucí rychlostí blížícího se podnětu. Druhým modelem byl normativní model založený na bayesovské teorii rozhodování. Tento model úspěšně replikoval mnoho klíčových charakteristik kódování PPP. Abychom prozkoumali vývoj reprezentace PPP s daty interakce podobné interakci dítěte a pečovatele, vytvořili jsme model využívající nezpracované vizuálně-taktilní vstupy. Začali jsme s hlubokou neuronovou sítí založenou na prediktivním kódování pro predikci dalšího snímku videa, která dosáhla výkonu na úrovni nejlepších aktuálních metod. Následně byla tato síť rozšířena o taktilní modalitu a využila nezpracované vizuálně-taktilní vstupy gene-rované během interakce mezi humanoidním robotem a osobou, která napodobuje interakci mezi dítětem a pečovatelem. Zpráva o této probíhající práci s předběžnými výsledky je součástí práce.cze
dc.description.abstractThe encoding of space in close proximity to the body, referred to as peripersonal space (PPS), is believed to contribute significantly to defensive behavior and consequently, survival. Despite numerous empirical findings on PPS representations in both humans and monkeys, the neural mechanisms underlying these processes remain largely unknown. In this thesis, we primarily investigate the idea that visuo-tactile (or audio-tactile) prediction---the use of a visual (or auditory) stimulus to predict a future contact with the body perceived through touch---is a key mechanism of PPS encoding, as initial evidence suggests. We started with the tactile modality and developed biologically-inspired representation of large areas of the body surface of the humanoid robot. The representation was based on a modified self-organizing map neural network, trained on tactile data from the humanoid robot, which allowed to incorporate prior knowledge about the representation of the body surface in the primary somatosensory cortex. This research was employed to investigate the process of formation of the representation. This was followed by models performing visuo-tactile prediction. One model employed a neural network architecture which combined a Restricted Boltzmann Machine to integrate position and velocity, with a feedforward neural network for predicting future contact with the body. The model demonstrated the feasibility of visuo-tactile prediction by replicating the phenomenon of PPS expansion, which occurs as velocity of an approaching stimulus increases. The second model was a Bayesian Decision Theory based normative model. This model successfully replicated many crucial characteristics of PPS encoding. In order to investigate the development of PPS encoding with child-caregiver-like interaction data, we created a model utilizing raw visuo-tactile inputs. We began with a deep neural network based on predictive coding for next-frame video prediction that achieved state-of-the-art performance. Subsequently, this network was extended to include the tactile modality and utilized raw visuo-tactile inputs generated during an interaction between a humanoid robot and a person, emulating the interaction between a child and a caregiver. The ongoing work report with preliminary results is included in the thesis.eng
dc.publisherČeské vysoké učení technické v Praze. Vypočetní a informační centrum.cze
dc.publisherCzech Technical University in Prague. Computing and Information Centre.eng
dc.rightsA university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.htmleng
dc.rightsVysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.htmlcze
dc.subjectperipersonal spacecze
dc.subjectvisuo-tactile predictioncze
dc.subjectneural networkscze
dc.subjectnext-frame video predictioncze
dc.subjectartificial skincze
dc.subjectself-organizing mapscze
dc.subjecthumanoid robotcze
dc.subjectpredictive codingcze
dc.subjectperipersonal spaceeng
dc.subjectvisuo-tactile predictioneng
dc.subjectneural networkseng
dc.subjectnext-frame video predictioneng
dc.subjectartificial skineng
dc.subjectself-organizing mapseng
dc.subjecthumanoid roboteng
dc.subjectpredictive codingeng
dc.titleJak se naučit reprezentovat peripersoání prostor: Od mozku k robotůmcze
dc.titleLearning peripersonal space representations: From brains to robotseng
dc.typedisertační prácecze
dc.typedoctoral thesiseng
dc.contributor.refereeIannetti Giandomenico
theses.degree.disciplineUmělá inteligence a biokybernetikacze
theses.degree.grantorkatedra kybernetikycze
theses.degree.programmeElektrotechnika a informatikacze


Soubory tohoto záznamu


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam