TRI Home Robot Image1

 

Le vieillissement de la population mondiale s’accélère et cette tendance a des conséquences planétaires. Les politiques publiques jouent un rôle clé dans la prise en compte des répercussions socio-économiques de l’évolution démographique. Mais nous croyons que les progrès des capacités robotiques seront essentiels pour permettre aux gens de vivre plus longtemps à domicile et de leur procurer une meilleure qualité de vie.

 

L’Institut de recherche Toyota (TRI) s’attache à créer et éprouver les percées technologiques nécessaires pour rendre les robots domestiques réalisables. En 2015, Gill Pratt, notre PDG, a déclaré que la clé de l’« explosion cambrienne » de la robotique est la combinaison de la robotique infonuagique et de l’apprentissage profond. C’est ce qu’on appelle le « fleet learning », ou l’apprentissage par parc : si nous permettons à un robot d’apprendre à exécuter une tâche, soit d’une personne, soit en simulation, puis de partager cette connaissance avec tous les autres robots, de sorte qu’ils puissent exécuter cette tâche dans de nouvelles situations, nous pourrons atteindre une augmentation exponentielle des capacités robotiques.

Au début de l’année, Russ Tedrake, vice-président de la recherche robotique au TRI, a expliqué dans un article pourquoi la simulation est un aspect clé du « fleet learning » et qu’elle nous permet d’assurer la fiabilité des robots lors de leur apprentissage. Un autre aspect clé est la capacité d’une personne à enseigner à un robot comment exécuter une tâche, en tirant parti de l’intelligence et de la perspicacité humaines pour guider la capacité physique du robot. Pour aider à motiver cet aspect du « fleet learning », nous avons lancé un défi de recherche pour enseigner à un robot polyvalent à effectuer des tâches utiles au domicile de vrais gens.

Les robots éprouvent de grandes difficultés à fonctionner et naviguer dans un environnement domestique. Chaque résidence est unique, constituée d’une combinaison différente d’objets dans des configurations distinctes qui évoluent au fil du temps. Pour tenir compte de la diversité à laquelle un robot est confronté dans un environnement domestique, nous lui apprenons à exécuter des tâches arbitraires avec une variété d’objets, plutôt que de le programmer pour effectuer des tâches prédéfinies avec des objets donnés. Ainsi, le robot apprend à relier ce qu’il voit aux actions qu’on lui enseigne. Lorsqu’il revoit un objet ou un scénario particulier, il sait quelles actions entreprendre, même si la scène n’est pas exactement identique.

Nous apprenons au robot à l’aide d’un système de téléprésence immersive contenant un modèle du robot qui reflète ses faits et gestes. L’enseignant voit ce que le robot voit en direct, en 3D, à partir des capteurs du robot. L’enseignant peut sélectionner différents comportements pour instruire puis annoter la scène 3D, par exemple en associant des parties de la scène à un comportement, en précisant comment saisir une poignée ou en traçant la ligne qui définit l’axe de rotation d’une porte d’armoire. Lors de l’enseignement d’une tâche, une personne peut essayer différentes approches, en faisant appel à sa créativité pour utiliser les mains et les outils du robot pour effectuer la tâche. Cela facilite l’exploitation et l’utilisation des différents outils, et permet aux humains de transférer rapidement leurs connaissances au robot dans des situations précises.

Historiquement, les robots, comme la plupart des voitures automatisées, perçoivent continuellement leur environnement, prédisent un chemin sûr, puis calculent un plan de mouvements fondé sur cette compréhension. À l’autre extrémité du spectre, de nouvelles méthodes d’apprentissage profond calculent les actions motrices de bas niveau directement à partir d’entrées visuelles, ce qui nécessite une quantité importante de données de la part du robot qui effectue la tâche. Nous empruntons la voie du milieu. Notre système d’enseignement n’a besoin de comprendre que ce qui l’entoure et qui a un rapport avec le comportement en cours d’exécution. Au lieu de relier les actions motrices de bas niveau à ce qu’il voit, il utilise des comportements de haut niveau. Par conséquent, notre système n’a pas besoin de modèles d’objets ou de cartes antérieurs. On peut lui apprendre à associer un ensemble donné de comportements à des scènes, des objets et des commandes vocales arbitraires à partir d’une seule démonstration du comportement. Cela facilite également la compréhension du système ainsi que le diagnostic et la reproduction des conditions de panne.

Notre robot est spécialement conçu pour faciliter l’apprentissage et l’exécution de ces tâches. Comme un humain, le robot jouit de nombreux degrés de liberté redondants, ce qui lui permet de déplacer ses mains comme il en a envie et quand il en a envie, en ajustant sa posture corporelle en conséquence. Le robot est également équipé de caméras visuelles et de profondeur offrant un très large champ de vision. Cela fournit un contexte important à la fois à la personne chargée d’apprendre au robot et au robot lui-même.

Nous effectuons l’apprentissage et les essais dans des résidences réelles. C’est indispensable pour que nos robots acquièrent des capacités et une fiabilité suffisantes. Nos robots sont des prototypes de recherche et nous choisissons des tâches qui favorisent et font progresser le développement d’algorithmes, plutôt que de démontrer des concepts de produits. Les connaissances acquises grâce à nos expériences nous permettent de répéter et d’ajuster constamment la façon dont nous abordons les problèmes, tant au niveau du matériel que des logiciels. Actuellement, notre système est capable d’exécuter avec succès des tâches de niveau humain relativement complexes environ 85 % du temps. Ceci inclut le fait de laisser le robot réessayer automatiquement s’il reconnaît qu’il n’a pas exécuté avec succès un comportement particulier. Chaque tâche est constituée d’environ 45 comportements indépendants, ce qui signifie que chaque comportement individuel se traduit par une réussite ou un échec rattrapable 99,6 % du temps.

Notre approche pourrait facilement s’étendre au-delà des résidences et s’appliquer à d’autres environnements. Par exemple, une personne pourrait rapidement et à distance apprendre à un bras industriel dans une usine à exécuter des tâches répétitives, ou ajuster rapidement une tâche de ramassage-déplacement pour un robot logistique. L’une des principales limites de notre approche est que les tâches enseignées ne peuvent actuellement pas être généralisées à d’autres robots ou à d’autres situations. Nous pensons cependant que l’enseignement de tâches à un robot est une première étape prometteuse vers la réalisation de notre vision plus large du « fleet learning », en particulier pour aider et autonomiser les gens à domicile. Et nous espérons que les progrès que nous avons réalisés profiteront à la communauté robotique. Les détails techniques de notre système sont décrits en profondeur dans un article pré-imprimé d’une publication.