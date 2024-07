Doblar prendas de manera fiable y eficiente es un desafío para las manos robóticas. Requiere de una enorme cantidad de datos, con una dinámica que es mucho más compleja de lo que parece. El sistema SpeedFolding es una de las soluciones más avanzadas en este ámbito. El robot manipula una prenda inicialmente arrugada a partir las instrucciones definidas por el usuario, como las líneas de plegado, hasta obtener una configuración suave y doblada.

Sus diseñadores quedaron finalistas en el premio al mejor trabajo de investigación en la Conferencia Internacional de Robots y Sistemas Inteligentes del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE por sus siglas en inglés). Tuvieron que inventar una nueva arquitectura de red neuronal (una de las formas de poner en acción la inteligencia artificial) que fuera capaz de predecir los pares de posiciones de la pinza. Después de aprender de 4.300 acciones autosupervisadas, el robot podía doblar las prendas, que se le entregaban en una configuración inicial aleatoria, en menos de 120 segundos, con una tasa de éxito del 93%.

En el equipo investigador de ese experimento aparece uno de los nombres propios de la robótica inteligente mundial, Torsten Kroeger, director científico de Intrinsic, la empresa con la que Alphabet, propietaria de Google, quiere conseguir que los robots tradicionales, a partir de instrucciones informáticas, adquieran la capacidad de detectar, aprender y hacer ajustes automáticamente a medida que completan tareas.

Ni una línea de código

El público rompió en aplausos cuando Kroeger apareció en el escenario de la Cumbre de la Inteligencia Artificial con Propósito de Múnich, a la que asistió ‘activos tech’. "Construir robots con inteligencia artificial debe ser mucho más fácil", proclamó. Ese es el reto: entrenarlos utilizando, en lugar de miles de imágenes, apenas una decena de ellas. Y sin escribir ni una línea de código, es decir, ninguna de esas instrucciones que suelen utilizar los informáticos para programar tareas.

"La IA impulsará el mayor cambio en la robótica del siglo XXI"

Kroeger repasó en la ciudad alemana muchos de los contenidos de la intervención que hizo en el mes de mayo en el Automate Show de Chicago, donde compartió escenario con la CEO de Intrinsic, Wendy Tan White, para quien "el mayor cambio en la robótica del siglo XXI estará impulsado por la inteligencia artificial".

Conocemos ya lo que la IA es capaz de hacer con textos, imágenes y sonidos, ¿quién no le ha formulado una pregunta a ChatGPT o le ha pedido que genere una representación? Pero la gran revolución todavía está por venir, porque "la inteligencia artificial se va a trasladar al mundo físico", sentenció: en lugar de usar palabras y responder a nuestras preguntas, "funcionará con acciones físicas reales en el mundo real".

Reducir costes

El problema es que "recolectar datos para los robots es caro", subrayó Torsten en Múnich. Lo es, en efecto. Programar los sistemas de inteligencia artificial generativa, la que se encuentra detrás de fenómenos como ChatGPT, exige una enorme cantidad de tiempo y de personal. El desafío es reducir costes acortando plazos.

Intrinsic ha colaborado mano a mano con NVIDIA para enseñar a los robots a agarrar objetos. Los han entrenado con datos puramente sintéticos, es decir, sin un referente real, creados artificialmente. Los movimientos no se programaron manualmente, no se escribió ni una sola línea de código. Todo eso no era necesario porque aprendieron gracias a la inteligencia artificial.

A continuación, tras desarrollar el modelo, se subió como una habilidad a la plataforma de Intrinsic, llamada Flow State, y ya estaba lista para implementarse en los robots de cualquier cliente. El primero en probarlo fue Trumpf, uno de los proveedores de máquina herramienta líderes del mundo. "La ventaja actual es que con el gemelo digital puedes cambiar el robot, la pinza, el entorno, y obtienes mucha flexibilidad", explicó Kroeger. El robot de Trumpf coge piezas de chapa de un contenedor y las clasifica cuidadosamente en otro contenedor. Y si cambia el entorno, no hace falta reprogramarlo, basta solo con modificar el modelo en el gemelo digital.

Otro de los retos para trasladar la inteligencia artificial al mundo físico es la planificación del movimiento de múltiples robots. Google Deepmind se hizo popular en todo el mundo al vencer al campeón mundial de go, un juego de mesa ancestral chino. "Estamos usando los algoritmos que se desarrollaron en aquel juego para la planificación del movimiento de los robots", detalló el director científico de Intrinsic. "En un par de horas, puedes entrenar un modelo con cuatro robots. El proceso es de media el 25% más rápido que el que logran los ingenieros humanos".

Robomotion mecanizó una máquina en un par de horas con Flow State, "antes les costaba varios días programar estos movimientos en la forma tradicional", apunta Wendy Tan White. La italiana Comau detuvo un proceso de fabricación de frigoríficos en plena ejecución, hizo que alguien se acercara y moviera el refrigerante, "y todo el proceso se readaptó en tiempo real, es el tipo de flexibilidad que la inteligencia artificial puede proporcionar a las aplicaciones en el futuro", añade.

Modelo de lenguaje

En la Cumbre de la Inteligencia Artificial con Propósito, la start-up NXAI presentó el primer gran modelo de lenguaje (LLM) europeo, sobre el que se puede articular el desarrollo de inteligencias artificiales. Han escogido una vía alternativa a la que dio lugar a ChatGPT, que se basa en una tecnología denominada transformers, difundida en 2017 por Google. Albert Ortig y Johannes Brandstetter, fundadores de NXAI, detallaron que se puede "iniciar una revolución en la simulación similar a la del plegamiento de proteínas biológicas" que encumbró hace unos años a DeepMind. La simulación es la clave para entrenar rápido a la IA en el mundo físico.

El director de relaciones de negocio de Bayerische KI-Agentur, Andreas Preisser, remarcó por su parte que nadie "puede hacer esto solo": "Necesitamos poner los datos de diferentes sectores en común, hoy más que nunca". Una idea que Kroeger secundó: "No podemos hacer esto solos. Es una oportunidad para trabajar juntos como comunidad, para habilitar más y más aplicaciones".

Una de las cosas que faltan en el mapa del nuevo mundo para entrenar a la inteligencia artificial son imágenes de calidad del mundo físico. Florian Bohne, jefe de ingeniería asistida por ordenador de Inpro, usa la inteligencia artificial para crear imágenes sintéticas. No son reales, pero deben parecerlo para que el entrenamiento de los robots sea preciso. Entre los retos figura producirlas en 3D, "es más desafiante, porque la luz, la posición, el reflejo… son cosas más difíciles de controlar".

Las empresas van a tener que orquestar diferentes inteligencias artificiales en sus organizaciones de la forma más eficiente posible. Rainer Brehm, CEO de automatización industrial de Siemens, relató lo que ha costado introducir Copilot, una inteligencia artificial generativa de Microsoft, en los procesos de producción. Para ello decidieron aliarse con el fabricante de brazos robóticos Schaeffler. Los operarios hoy pueden hablar con la máquina, consultarle dudas sobre el manual técnico y averiguar en conversación con ella si necesita mantenimiento.

"Los problemas técnicos aparecen cuando quieres demostrar que funciona a escala", manifestó Brehm. ¿Por qué debería haber pantallas, si podemos relacionarnos con un asistente de voz inteligente? Cambian todas las reglas del juego de la automatización. "Tenemos que cuestionarnos todo lo que hacíamos en el pasado - sentenció el directivo de Siemens-, debemos repensar todos los patrones, necesitaremos automatizar, pero de una forma completamente diferente".