Un modelo de inteligencia artificial (IA) desarrollado por la tecnológica estadounidense Nvidia está revolucionando el campo de la robótica al enseñar a los robots habilidades complejas que anteriormente se consideraban exclusivas de los seres humanos.
Impulsado por GPT-4, este agente de IA es capaz de generar algoritmos de recompensa autónomamente para entrenar una amplia variedad de robots, incluyendo cuadrúpedos, bípedos, cuadricópteros, manos robóticas y brazos colaborativos (Cobots), en una diversidad de tareas que van desde abrir cajones hasta atrapar pelotas.
Aprendizaje por refuerzo y algoritmos superiores
Este avance se basa en el aprendizaje por refuerzo, un tipo de aprendizaje automático que permite a los agentes aprender de sus propias acciones y retroalimentación. Lo más sorprendente es que los algoritmos de recompensa generados por el modelo, conocido como «Eureka», superan a los escritos por expertos humanos en más del 80% de las tareas, lo que resulta en un aumento del rendimiento promedio superior al 50% para los robots.
Tecnologías aceleradas por GPU para Eureka
Eureka funciona junto con tecnologías de simulación aceleradas por GPU de Nvidia, incluyendo Isaac Gym, una aplicación referencial para simulación física en investigación sobre aprendizaje por refuerzo; y Omniverse, una plataforma para el desarrollo 3D basada en el marco OpenUSD. Estas herramientas permiten a Eureka evaluar eficientemente la calidad de los candidatos a recompensa para un entrenamiento más efectivo.
Eureka: IA que se perfecciona a sí misma
Lo más destacado es que Eureka es capaz mejorar su propio rendimiento. Construye resúmenes de estadísticas clave a partir de los resultados del entrenamiento e instruye a su modelo de lenguaje para mejorar la generación de funciones de recompensa. En resumen, esta IA se perfecciona a sí misma.
Un paso hacia nuevos algoritmos
Los investigadores consideran que Eureka representa un paso importante hacia el desarrollo de nuevos algoritmos que combinan métodos de aprendizaje generativo y por refuerzo para resolver tareas difíciles. Además, anticipan que esta tecnología tendrá un impacto significativo en el control de robots hábiles y en la producción de animaciones físicamente realistas para artistas.
Cuestiones y preocupaciones
Sin embargo, este avance en la incorporación de inteligencia artificial en la robótica también plantea cuestiones y preocupaciones en la sociedad. Algunos plantean que esta nueva tecnología generará desempleo y reemplazo de trabajadores humanos, control y autonomía, seguridad y ciberataques, desarrollo no ético, dependencia excesiva, sesgo y discriminación.