Le projet intitulé « Rapid Motor Adaptation » (RMA) et conçu par Les chercheurs de Facebook AI Research (FAIR), en partenariat avec Berkeley AI Research et l’Université Carnegie Mellon est le premier système d’apprentissage basé sur l’Intelligence Artificielle (IA) qui apprend aux robots marcheurs à s’adapter intelligemment et en temps réel à de nouveaux terrains et circonstances difficiles et inconnus - un peu comme le font les enfants.
Les enfants découvrent comment ajuster leur pas et leur cadence pour marcher facilement dans la boue, l’eau, monter et descendre des collines. Par essais et erreurs, ils s’adaptent et trouvent les meilleures façons de bouger. Cette capacité d’apprentissage et d’adaptabilité est ce que RMA apportera aux robots.
Apprendre aux robots à s’adapter
Jusqu’à présent, les robots à jambes étaient soit entièrement codés à la main pour qu’ils puissent s’adapter aux environnements qu’ils allaient occuper, soit entraînés à naviguer dans leur environnement grâce à une combinaison de codage à la main et de techniques d’apprentissage.
RMA est le premier système entièrement basé sur l’apprentissage qui permet à un robot marcheur de s’adapter à son environnement (sols rocailleux, huileux, pentus ou mous) en partant de zéro, en explorant et en interagissant avec le monde.
Comme cette méthode nécessite un grand nombre d’essais, les chercheurs ont privilégié une approche par la simulation. Les données issues de différents terrains sont fournies au robot afin qu’il puisse tester différentes approches et retenir les meilleurs mouvements à accomplir en fonction du type de terrain.
Vers une évaluation de l’environnement
L’apprentissage supervisé intervient au niveau du « module d’adaptation » du robot. Il permet au robot d’évaluer son environnement en temps réel à partir des informations glanées par ses capteurs lors de son dernier mouvement. Celles-ci apportent des indications supplémentaires sur la nature du terrain, comme par exemple un sol meuble dans lequel les jambes du robot s’enfoncent ou une variation dans la hauteur sur laquelle les jambes viennent buter.
Ces paramètres dits extrinsèques, bien connus et identifiés, ont été fournis au module par les chercheurs. Cet apprentissage supervisé permet au système de mieux appréhender l’environnement à partir de l’historique récent de l’état du robot.
Les enfants découvrent comment ajuster leur pas et leur cadence pour marcher facilement dans la boue, l’eau, monter et descendre des collines. Par essais et erreurs, ils s’adaptent et trouvent les meilleures façons de bouger. Cette capacité d’apprentissage et d’adaptabilité est ce que RMA apportera aux robots.
Apprendre aux robots à s’adapter
Jusqu’à présent, les robots à jambes étaient soit entièrement codés à la main pour qu’ils puissent s’adapter aux environnements qu’ils allaient occuper, soit entraînés à naviguer dans leur environnement grâce à une combinaison de codage à la main et de techniques d’apprentissage.
RMA est le premier système entièrement basé sur l’apprentissage qui permet à un robot marcheur de s’adapter à son environnement (sols rocailleux, huileux, pentus ou mous) en partant de zéro, en explorant et en interagissant avec le monde.
Comme cette méthode nécessite un grand nombre d’essais, les chercheurs ont privilégié une approche par la simulation. Les données issues de différents terrains sont fournies au robot afin qu’il puisse tester différentes approches et retenir les meilleurs mouvements à accomplir en fonction du type de terrain.
Vers une évaluation de l’environnement
L’apprentissage supervisé intervient au niveau du « module d’adaptation » du robot. Il permet au robot d’évaluer son environnement en temps réel à partir des informations glanées par ses capteurs lors de son dernier mouvement. Celles-ci apportent des indications supplémentaires sur la nature du terrain, comme par exemple un sol meuble dans lequel les jambes du robot s’enfoncent ou une variation dans la hauteur sur laquelle les jambes viennent buter.
Ces paramètres dits extrinsèques, bien connus et identifiés, ont été fournis au module par les chercheurs. Cet apprentissage supervisé permet au système de mieux appréhender l’environnement à partir de l’historique récent de l’état du robot.
H. C.