Learning peripersonal space representations: From brains to robots

dc.contributor.advisor Svoboda, Tomáš
dc.contributor.author Straka, Zdeněk
dc.contributor.referee Iannetti Giandomenico
dc.date.accessioned 2023-10-24T07:19:17Z
dc.date.available 2023-10-24T07:19:17Z
dc.date.issued 2023-09-11
dc.description.abstract Předpokládá se, že reprezentace prostoru v těsné blízkosti těla (peripersonální prostor -- PPP), významně přispívá k obrannému chování a tím i k přežití. Navzdory četným empirickým poznatkům o reprezentaci PPP u lidí i opic, zůstávají neurální mechanismy, které jsou základem těchto procesů, z velké části neznámé. V této práci se zabýváme především myšlenkou, že vizuálně-taktilní (nebo zvukově-taktilní) predikce -- vizuální (nebo zvukový) podnět se využije k předpovědi budoucího kontaktu s tělem vnímaného prostřednictvím dotyku -- je klíčovým mechanismem reprezentace PPP, jak naznačují první poznatky. Tento mechanismus jsme zkoumali pomocí výpočetních modelů. Začali jsme s hmatovou modalitou a vyvinuli jsme biologicky inspirovanou reprezentaci velkých ploch povrchu těla humanoidního robota. Reprezentace byla založena na modifikované neuronové síti samoorganizující se mapy, natrénované na taktilních datech z humanoidního robota, což umožnilo zahrnout předchozí znalosti o reprezentaci povrchu těla v primární somatosenzorické kůře. Tento výzkum byl využit ke zkoumání procesu tvorby této reprezentace. Následovaly modely provádějící vizuálně-taktilní predikci. První model využíval architekturu neuronové sítě, která kombinovala omezený Boltzmannův stroj pro integraci polohy a rychlosti s dopřednou neuronovou sítí pro předpovídání budoucího kontaktu s tělem. Model prokázal proveditelnost vizuálně-taktilní predikce replikováním jevu expanze PPP, ke kterému dochází s rostoucí rychlostí blížícího se podnětu. Druhým modelem byl normativní model založený na bayesovské teorii rozhodování. Tento model úspěšně replikoval mnoho klíčových charakteristik kódování PPP. Abychom prozkoumali vývoj reprezentace PPP s daty interakce podobné interakci dítěte a pečovatele, vytvořili jsme model využívající nezpracované vizuálně-taktilní vstupy. Začali jsme s hlubokou neuronovou sítí založenou na prediktivním kódování pro predikci dalšího snímku videa, která dosáhla výkonu na úrovni nejlepších aktuálních metod. Následně byla tato síť rozšířena o taktilní modalitu a využila nezpracované vizuálně-taktilní vstupy gene-rované během interakce mezi humanoidním robotem a osobou, která napodobuje interakci mezi dítětem a pečovatelem. Zpráva o této probíhající práci s předběžnými výsledky je součástí práce. cs
dc.description.abstract The encoding of space in close proximity to the body, referred to as peripersonal space (PPS), is believed to contribute significantly to defensive behavior and consequently, survival. Despite numerous empirical findings on PPS representations in both humans and monkeys, the neural mechanisms underlying these processes remain largely unknown. In this thesis, we primarily investigate the idea that visuo-tactile (or audio-tactile) prediction---the use of a visual (or auditory) stimulus to predict a future contact with the body perceived through touch---is a key mechanism of PPS encoding, as initial evidence suggests. We started with the tactile modality and developed biologically-inspired representation of large areas of the body surface of the humanoid robot. The representation was based on a modified self-organizing map neural network, trained on tactile data from the humanoid robot, which allowed to incorporate prior knowledge about the representation of the body surface in the primary somatosensory cortex. This research was employed to investigate the process of formation of the representation. This was followed by models performing visuo-tactile prediction. One model employed a neural network architecture which combined a Restricted Boltzmann Machine to integrate position and velocity, with a feedforward neural network for predicting future contact with the body. The model demonstrated the feasibility of visuo-tactile prediction by replicating the phenomenon of PPS expansion, which occurs as velocity of an approaching stimulus increases. The second model was a Bayesian Decision Theory based normative model. This model successfully replicated many crucial characteristics of PPS encoding. In order to investigate the development of PPS encoding with child-caregiver-like interaction data, we created a model utilizing raw visuo-tactile inputs. We began with a deep neural network based on predictive coding for next-frame video prediction that achieved state-of-the-art performance. Subsequently, this network was extended to include the tactile modality and utilized raw visuo-tactile inputs generated during an interaction between a humanoid robot and a person, emulating the interaction between a child and a caregiver. The ongoing work report with preliminary results is included in the thesis. en
dc.identifier KOS-778758401205
dc.identifier.uri http://hdl.handle.net/10467/112296
dc.publisher České vysoké učení technické v Praze cs
dc.publisher Czech Technical University in Prague en
dc.rights A university thesis is a work protected by the Copyright Act of the Czech Republic. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one`s own expense. The use of thesis should be in compliance with the Copyright Act. en
dc.rights Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem v platném znění. cs
dc.subject peripersonal space cs
dc.subject visuo-tactile prediction cs
dc.subject neural networks cs
dc.subject next-frame video prediction cs
dc.subject artificial skin cs
dc.subject self-organizing maps cs
dc.subject humanoid robot cs
dc.subject predictive coding cs
dc.subject peripersonal space en
dc.subject visuo-tactile prediction en
dc.subject neural networks en
dc.subject next-frame video prediction en
dc.subject artificial skin en
dc.subject self-organizing maps en
dc.subject humanoid robot en
dc.subject predictive coding en
dc.title Jak se naučit reprezentovat peripersoání prostor: Od mozku k robotům cs
dc.title Learning peripersonal space representations: From brains to robots en
dc.type disertační práce cs
dc.type doctoral thesis en
dspace.entity.type Publication
relation.isAdvisorOfPublication ad6eda77-0131-45e0-a281-f92e6f9948d9
relation.isAdvisorOfPublication.latestForDiscovery ad6eda77-0131-45e0-a281-f92e6f9948d9
relation.isAuthorOfPublication ce7e6195-e882-40f9-9252-1a416d0be4a8
relation.isAuthorOfPublication.latestForDiscovery ce7e6195-e882-40f9-9252-1a416d0be4a8
theses.degree.discipline Umělá inteligence a biokybernetika cs
theses.degree.grantor katedra kybernetiky cs
theses.degree.programme Elektrotechnika a informatika cs

Files

Original bundle

Now showing 1 - 1 of 1
Name:
F3-D-2023-Straka-Zdenek-Straka___PhD_thesis_final.pdf
Size:
42.34 MB
Format:
Adobe Portable Document Format
Description:
PLNY_TEXT