Sistema de Controle do Robô Cheetah
Conheça o novo sistema de controle do robô quadrúpede do MIT
Por Paulo Victor Oliveira | 05 de Novembro de 2021
Nos últimos anos, robôs de quatro patas inspirados no movimento de guepardos e outros animais deram grandes saltos tecnológicos, mas ainda estão atrás de seus colegas mamíferos quando se trata de viajar por uma paisagem com mudanças rápidas de elevação.
O robô quadrúpede Cheetah desenvolvido pelo Instituto de Tecnologia de Massachusetts (MIT, na sigla inglês), pode trotar em terrenos irregulares cerca de duas vezes mais rápido que a velocidade de caminhada de uma pessoa média, além de pular obstáculos automaticamente.
Sumário
Novo Sistema de Controle
Recentemente os pesquisadores do MIT desenvolveram um sistema de controle que melhora a velocidade e agilidade de robôs com pernas à medida que saltam através de lacunas no terreno. O novo sistema de controle é dividido em duas partes – uma que processa a entrada em tempo real de uma câmera de vídeo montada na frente do robô e outra que traduz essas informações em instruções sobre como ele deve mover seu corpo. Ele foi testado no Mini Cheetah, que é uma versão mais compacta e ágil.
Ao contrário de outros métodos para controlar um robô de quatro patas, este sistema de duas partes não exige que o terreno seja mapeado com antecedência, para que o robô possa ir a qualquer lugar. No futuro, isso pode permitir que robôs partam para a floresta em uma missão de resposta a emergências ou subam um lance de escadas para entregar medicamentos a um idoso recluso.
O uso de dois controladores separados trabalhando juntos torna este sistema especialmente inovador. Um controlador é um algoritmo que converterá o estado do robô em um conjunto de ações a serem seguidas. Muitos controladores cegos (aqueles que não incorporam visão) são robustos e eficazes, mas apenas permitem que os robôs andem em terreno contínuo.
A visão é uma entrada sensorial tão complexa para processar que esses algoritmos são incapazes de lidar com isso de forma eficiente. Os sistemas que incorporam a visão geralmente contam com um “mapa de altura” do terreno, que deve ser pré-construído ou gerado em tempo real, um processo que normalmente é lento e propenso a falhas se o mapa de altura estiver incorreto.
Como Desenvolveram o Sistema
Para desenvolver o sistema, os pesquisadores pegaram os melhores elementos desses controladores (robustos e cegos) e os combinaram com um módulo separado que lida com a visão em tempo real. A câmera captura imagens de profundidade do terreno próximo, que são alimentadas a um controlador de alto nível junto com informações sobre o estado do corpo do robô (ângulos das articulações, orientação do corpo, etc.). O controlador de alto nível é uma rede neural que “aprende” com a experiência.
Essa rede neural gera uma trajetória de destino, que o segundo controlador usa para criar torques para cada uma das 12 articulações do robô. Esse controlador de baixo nível não é uma rede neural e, em vez disso, depende de um conjunto de equações físicas concisas que descrevem o movimento do robô.
Os pesquisadores usaram o método de tentativa e erro conhecido como aprendizado por reforço para treinar o controlador de alto nível. Eles realizaram simulações do robô percorrendo centenas de terrenos descontínuos diferentes e o recompensaram por travessias bem-sucedidas. Com o tempo, o algoritmo aprendeu quais ações maximizaram a recompensa.
Em seguida, construíram um terreno físico e aberto com um conjunto de tábuas de madeira e testaram seu esquema de controle usando o Mini Cheetah.
Estimar o estado do robô provou ser um desafio em alguns casos. Ao contrário da simulação, os sensores do mundo real encontram ruídos que podem se acumular e afetar o resultado. Assim, para alguns experimentos que envolveram o posicionamento de pés de alta precisão, os pesquisadores usaram um sistema de captura de movimento para medir a verdadeira posição do robô.
Seu sistema superou outros que usam apenas um controlador, e o Mini Cheetah cruzou com sucesso 90% dos terrenos.
Conclusão
Futuramente eles esperam montar um computador mais poderoso no robô para que possa fazer toda a computação a bordo, além de melhorar o estimador de estado para eliminar a necessidade do sistema de captura de movimento. Eles também querem melhorar o controlador de baixo nível para que ele possa explorar toda a amplitude de movimento do robô e aprimorar o controlador de alto nível para que funcione bem em diferentes condições de iluminação.