Efficient Self-exploration and Learning of Forward and Inverse Models on a Humanoid Robot with Artificial Skin
Efektivní sebe-explorace a tvorba modelu těla u humanoidního robota s umělou kůží
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
Upravili jsme model humanoidního robota NAO v prostředí založeném na ROS a fyzickém simulátoru Gazebo tím, že jsme přidali umělou kůži citlivou na dotek. V tomto prostředí byla provedena série experimentů inspirovaných výzkumem vývojové psychologie v oblasti zkoumání vlastního těla. Cílem bylo naučit se dopředné a inverzní modely těla robota pomocí sebe-dotyku s umělou kůží jako jediným zdrojem zpětné vazby. Pro průzkum a učení modelů byla použita knihovna explauto. Cílem bylo využívat co nejméně informace o struktuře kinematického řetězce robota: byl znám pouze počet kloubů použitých v experimentu. Bylo testováno a porovnáno několik dopředných modelů, inverzních modelů a průzkumných strategií dostupných v knihovně explauto. Jako empirická míra kvality naučených modelů byla použita průměrná chyba dosažení několika cílů na těle robota. Výsledky provedených experimentů ukazují, že ze všech možností dostupných v knihovně explauto, poskytuje model nejbližšího souseda (nearest neighbor) nejmenší střední chybu dosažení. Výsledky také ukazují, že průzkumné strategie založené na dosažení cílů (goal babbling) jsou lepší než strategie založené na motor babbling. Konvergují rychleji a umožňují učení modelů s menší chybou. Ze všech výzkumných strategií, které jsou k dispozici v knihovně explauto, bylo dosaženo nejlepších výsledků pomocí pevné diskretizace pozorovacího prostoru. Tato strategie se zaměřuje na zkoumání v regionech, které jsou nejzajímavější, takže množství nových informací přidaných do modelu je maximalizováno. V závěrečné kapitole této práce jsou diskutovány některé možnosti dalšího výzkumu.
A model of NAO humanoid robot was modified and artificial skin with touch-sensitive taxels was added to it. Simulation environment based on ROS and Gazebo physics simulator was developed. In this environment, a series of experiments in self-exploration inspired by research in developmental psychology was conducted. The goal was to learn forward and inverse models of robot's body using self touch with artificial skin as the only source of sensory feedback. Explauto library was used for the exploration and model learning. As little prior information about the structure of robot's kinematic chain was provided to exploration algorithms: only number of joints used in the experiment was known. Several forward models, inverse models and exploration strategies available in explauto library were tested and compared. Mean reaching error over several goals on robot's body was used as an empirical measure of the quality of learnt models. Results of the conducted experiments show that out of all options available in explauto, nearest neighbor model produces smallest mean reaching error. Results also show that goal-based exploration strategies are better than strategies based on motor babbling. They converge faster and allow learning of models with smaller reaching error. Among all exploration strategies available in explauto, fixed discretization of observation space produced best results. This strategy focuses exploration in regions of most interest, so that amount of new information added to the model is maximized. Some possibilities open for further investigation and research are discussed in the closing chapter of this work.
A model of NAO humanoid robot was modified and artificial skin with touch-sensitive taxels was added to it. Simulation environment based on ROS and Gazebo physics simulator was developed. In this environment, a series of experiments in self-exploration inspired by research in developmental psychology was conducted. The goal was to learn forward and inverse models of robot's body using self touch with artificial skin as the only source of sensory feedback. Explauto library was used for the exploration and model learning. As little prior information about the structure of robot's kinematic chain was provided to exploration algorithms: only number of joints used in the experiment was known. Several forward models, inverse models and exploration strategies available in explauto library were tested and compared. Mean reaching error over several goals on robot's body was used as an empirical measure of the quality of learnt models. Results of the conducted experiments show that out of all options available in explauto, nearest neighbor model produces smallest mean reaching error. Results also show that goal-based exploration strategies are better than strategies based on motor babbling. They converge faster and allow learning of models with smaller reaching error. Among all exploration strategies available in explauto, fixed discretization of observation space produced best results. This strategy focuses exploration in regions of most interest, so that amount of new information added to the model is maximized. Some possibilities open for further investigation and research are discussed in the closing chapter of this work.
Description
Keywords
umělá kůže, humanoidní robot, reprezentace těla, goal babbling, motor babbling, dopředný model, explorace, inverzní model, vývojová robotika, ROS, Gazebo, NAO, artificial skin, humanoid robot, body representation, goal babbling, motor babbling, forward model, inverse model, exploration, intrinsic motivation, developmental robotics, ROS, Gazebo, NAO