Lifelong learning in bio-inspired locomotion control of multi-legged walking robots
Dlouhodobé učení v bioinspirovaném řízení lokomoce vícenohých kráčejících robotů
Authors
Supervisors
Reviewers
Editors
Other contributors
Journal Title
Journal ISSN
Volume Title
Publisher
České vysoké učení technické v Praze
Czech Technical University in Prague
Czech Technical University in Prague
Date
Abstract
Mobilní kráčející robot se během nasazení ve volné přírodě nemůže vyhnout novým situacím a má-li si udržet svou mobilitu, musí tyto situace průběžně integrovat do svého modelu světa. Opotřebení materiálu, poškození či modifikace těla a interakce s terénem jsou faktory měnící známou situaci na situaci neznámou, kterou už robot nemusí mít pod kontrolou. Avšak toto neznámo lze brát také jako zdroj nových zkušeností, které robotu rozšiřují nejen model světa, ale i svět ve kterém může operovat. Tato práce se věnuje vztahu mezi učícím se modelem světa a řízením lokomoce replikací principů pozorovaných v živočišné říši. Studium řízení lokomoce se zaměřuje na řízení chůze s využitím neuronového oscilátoru, který, za využití navrženého fázově-amplitudového řízení, ovládá šestinohé kráčející roboty s poškozením nebo v nerovném terénu. Návrh rozšiřitelného modelu světa je zaměřený na průbežné učení, při němž mohou být poznatky průběžně doplňovány či falsifikovány. Pro průběžné učení je navržena implementace a testovací metodologie, přičemž obojí je nasazené v doménách klasifikace obrazu a robotiky. Obě studie jsou sloučeny v řešení problému dlouhodobého průběžného učení a řízení lokomoce, v němž je navržen vztah mezi modelem světa a řízením. Navržená řešení jsou testovaná jak v simulovaném a reálném nasazení na šestinohém robotu s vysokým stupněm volnosti, tak i na elastickém robotickém rameni. Výsledky potvrzují, že soubor generativních modelů a modelem řízená chůze poskytuje komplexní chování, které se škáluje s rostoucími požadavky dynamického světa.
Through locomotion in the open world, walking robots inevitably experience novelty, which must be continually integrated into the robot's world model if the robot is to sustain its mobility. Material wear, leg damage, novel terrains, and embodiment upgrades are factors that drift the dynamic context from the robot's prior knowledge into the uncontrollable unknown. However, the unknown is a source of novel experience, and if learned, the robot gains control in a novel dynamic context, thus expanding both its world model and the world it walks on. The presented thesis reports on the research toward the self-reinforcing relation between a continually learned world model and locomotion control by studying and replicating universal principles that locomote evolving animals through countless biomes. The locomotion control research stream studies Central Pattern Generator, neural oscillators, and based gait control, where a proposed decoupled phase-amplitude control locomotes the hexapod walking robots with damage or in rough terrain. In the continual learning research stream, the world model is described as an ensemble of manifolds covering a sample space, and using this description, a continual learning scheme is proposed and tested with a generalized evaluation methodology on image datasets and in robotic transfer learning. The result of both challenges is fused in the lifelong continual locomotion learning, where the relation between the world model and locomotion control is proposed. The proposed principles are tested both in virtual and real deployments with a high degree of freedom on hexapod robots and on a soft-robot arm.The results corroborate that an ensemble of generative models and model-based gait control can bootstrap complex behaviors that scale with growing dynamic contexts and utilize them for further growth.
Through locomotion in the open world, walking robots inevitably experience novelty, which must be continually integrated into the robot's world model if the robot is to sustain its mobility. Material wear, leg damage, novel terrains, and embodiment upgrades are factors that drift the dynamic context from the robot's prior knowledge into the uncontrollable unknown. However, the unknown is a source of novel experience, and if learned, the robot gains control in a novel dynamic context, thus expanding both its world model and the world it walks on. The presented thesis reports on the research toward the self-reinforcing relation between a continually learned world model and locomotion control by studying and replicating universal principles that locomote evolving animals through countless biomes. The locomotion control research stream studies Central Pattern Generator, neural oscillators, and based gait control, where a proposed decoupled phase-amplitude control locomotes the hexapod walking robots with damage or in rough terrain. In the continual learning research stream, the world model is described as an ensemble of manifolds covering a sample space, and using this description, a continual learning scheme is proposed and tested with a generalized evaluation methodology on image datasets and in robotic transfer learning. The result of both challenges is fused in the lifelong continual locomotion learning, where the relation between the world model and locomotion control is proposed. The proposed principles are tested both in virtual and real deployments with a high degree of freedom on hexapod robots and on a soft-robot arm.The results corroborate that an ensemble of generative models and model-based gait control can bootstrap complex behaviors that scale with growing dynamic contexts and utilize them for further growth.