Jak se naučit reprezentovat peripersoání prostor: Od mozku k robotům

Zdeněk Straka

Learning peripersonal space representations: From brains to robots

dc.contributor.advisor	Svoboda Tomáš
dc.contributor.author	Zdeněk Straka
dc.date.accessioned	2023-10-24T07:19:17Z
dc.date.available	2023-10-24T07:19:17Z
dc.date.issued	2023-09-11
dc.identifier	KOS-778758401205
dc.identifier.uri	http://hdl.handle.net/10467/112296
dc.description.abstract	Předpokládá se, že reprezentace prostoru v těsné blízkosti těla (peripersonální prostor -- PPP), významně přispívá k obrannému chování a tím i k přežití. Navzdory četným empirickým poznatkům o reprezentaci PPP u lidí i opic, zůstávají neurální mechanismy, které jsou základem těchto procesů, z velké části neznámé. V této práci se zabýváme především myšlenkou, že vizuálně-taktilní (nebo zvukově-taktilní) predikce -- vizuální (nebo zvukový) podnět se využije k předpovědi budoucího kontaktu s tělem vnímaného prostřednictvím dotyku -- je klíčovým mechanismem reprezentace PPP, jak naznačují první poznatky. Tento mechanismus jsme zkoumali pomocí výpočetních modelů. Začali jsme s hmatovou modalitou a vyvinuli jsme biologicky inspirovanou reprezentaci velkých ploch povrchu těla humanoidního robota. Reprezentace byla založena na modifikované neuronové síti samoorganizující se mapy, natrénované na taktilních datech z humanoidního robota, což umožnilo zahrnout předchozí znalosti o reprezentaci povrchu těla v primární somatosenzorické kůře. Tento výzkum byl využit ke zkoumání procesu tvorby této reprezentace. Následovaly modely provádějící vizuálně-taktilní predikci. První model využíval architekturu neuronové sítě, která kombinovala omezený Boltzmannův stroj pro integraci polohy a rychlosti s dopřednou neuronovou sítí pro předpovídání budoucího kontaktu s tělem. Model prokázal proveditelnost vizuálně-taktilní predikce replikováním jevu expanze PPP, ke kterému dochází s rostoucí rychlostí blížícího se podnětu. Druhým modelem byl normativní model založený na bayesovské teorii rozhodování. Tento model úspěšně replikoval mnoho klíčových charakteristik kódování PPP. Abychom prozkoumali vývoj reprezentace PPP s daty interakce podobné interakci dítěte a pečovatele, vytvořili jsme model využívající nezpracované vizuálně-taktilní vstupy. Začali jsme s hlubokou neuronovou sítí založenou na prediktivním kódování pro predikci dalšího snímku videa, která dosáhla výkonu na úrovni nejlepších aktuálních metod. Následně byla tato síť rozšířena o taktilní modalitu a využila nezpracované vizuálně-taktilní vstupy gene-rované během interakce mezi humanoidním robotem a osobou, která napodobuje interakci mezi dítětem a pečovatelem. Zpráva o této probíhající práci s předběžnými výsledky je součástí práce.	cze
dc.description.abstract	The encoding of space in close proximity to the body, referred to as peripersonal space (PPS), is believed to contribute significantly to defensive behavior and consequently, survival. Despite numerous empirical findings on PPS representations in both humans and monkeys, the neural mechanisms underlying these processes remain largely unknown. In this thesis, we primarily investigate the idea that visuo-tactile (or audio-tactile) prediction---the use of a visual (or auditory) stimulus to predict a future contact with the body perceived through touch---is a key mechanism of PPS encoding, as initial evidence suggests. We started with the tactile modality and developed biologically-inspired representation of large areas of the body surface of the humanoid robot. The representation was based on a modified self-organizing map neural network, trained on tactile data from the humanoid robot, which allowed to incorporate prior knowledge about the representation of the body surface in the primary somatosensory cortex. This research was employed to investigate the process of formation of the representation. This was followed by models performing visuo-tactile prediction. One model employed a neural network architecture which combined a Restricted Boltzmann Machine to integrate position and velocity, with a feedforward neural network for predicting future contact with the body. The model demonstrated the feasibility of visuo-tactile prediction by replicating the phenomenon of PPS expansion, which occurs as velocity of an approaching stimulus increases. The second model was a Bayesian Decision Theory based normative model. This model successfully replicated many crucial characteristics of PPS encoding. In order to investigate the development of PPS encoding with child-caregiver-like interaction data, we created a model utilizing raw visuo-tactile inputs. We began with a deep neural network based on predictive coding for next-frame video prediction that achieved state-of-the-art performance. Subsequently, this network was extended to include the tactile modality and utilized raw visuo-tactile inputs generated during an interaction between a humanoid robot and a person, emulating the interaction between a child and a caregiver. The ongoing work report with preliminary results is included in the thesis.	eng
dc.publisher	České vysoké učení technické v Praze. Vypočetní a informační centrum.	cze
dc.publisher	Czech Technical University in Prague. Computing and Information Centre.	eng
dc.rights	A university thesis is a work protected by the Copyright Act. Extracts, copies and transcripts of the thesis are allowed for personal use only and at one?s own expense. The use of thesis should be in compliance with the Copyright Act http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf and the citation ethics http://knihovny.cvut.cz/vychova/vskp.html	eng
dc.rights	Vysokoškolská závěrečná práce je dílo chráněné autorským zákonem. Je možné pořizovat z něj na své náklady a pro svoji osobní potřebu výpisy, opisy a rozmnoženiny. Jeho využití musí být v souladu s autorským zákonem http://www.mkcr.cz/assets/autorske-pravo/01-3982006.pdf a citační etikou http://knihovny.cvut.cz/vychova/vskp.html	cze
dc.subject	peripersonal space	cze
dc.subject	visuo-tactile prediction	cze
dc.subject	neural networks	cze
dc.subject	next-frame video prediction	cze
dc.subject	artificial skin	cze
dc.subject	self-organizing maps	cze
dc.subject	humanoid robot	cze
dc.subject	predictive coding	cze
dc.subject	peripersonal space	eng
dc.subject	visuo-tactile prediction	eng
dc.subject	neural networks	eng
dc.subject	next-frame video prediction	eng
dc.subject	artificial skin	eng
dc.subject	self-organizing maps	eng
dc.subject	humanoid robot	eng
dc.subject	predictive coding	eng
dc.title	Jak se naučit reprezentovat peripersoání prostor: Od mozku k robotům	cze
dc.title	Learning peripersonal space representations: From brains to robots	eng
dc.type	disertační práce	cze
dc.type	doctoral thesis	eng
dc.contributor.referee	Iannetti Giandomenico
theses.degree.discipline	Umělá inteligence a biokybernetika	cze
theses.degree.grantor	katedra kybernetiky	cze
theses.degree.programme	Elektrotechnika a informatika	cze

Soubory tohoto záznamu

Název:: F3-D-2023-Straka-Zdenek-Straka ...
Velikost:: 42.33Mb
Formát:: PDF
Popis:: PLNY_TEXT
: Zobrazit/otevřít

Tento záznam se objevuje v následujících kolekcích

Disertační práce - 13000 [700]

Zobrazit minimální záznam

Jak se naučit reprezentovat peripersoání prostor: Od mozku k robotům

Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Související záznamy

Predikce obsazenosti veřejných parkovacích stání ﻿

Prediktivní řízení pro robota SK8O ﻿

Aplikace technik umělé inteligence v prediktivní údržbě ﻿

Predikce obsazenosti veřejných parkovacích stání

Prediktivní řízení pro robota SK8O

Aplikace technik umělé inteligence v prediktivní údržbě