Google revoluciona la robótica con Gemini Robotics, su IA para robots humanoides

Google revoluciona la robótica con Gemini Robotics, su IA para robots humanoides
Foto: Google Deep Mind

Google ha dado un paso significativo en el mundo de la inteligencia artificial (IA) con el lanzamiento de Gemini Robotics, un modelo diseñado para mejorar las capacidades de los robots humanoides y otros tipos de robots. Este modelo no solo aumenta la inteligencia de los robots, sino que también incluye una herramienta innovadora para dotarlos de una brújula moral, lo que permitirá tomar decisiones más éticas en diversas situaciones.

Gemini Robotics: una IA que fusiona lenguaje, visión y acción física

En un futuro donde la robótica juega un papel cada vez más importante, Google ha presentado su visión de cómo debe evolucionar esta tecnología. Los robots que incorporan el modelo Gemini Robotics combinan el lenguaje, la visión y la acción física para realizar tareas de forma más adaptable y útil. Esto se logra a través de una serie de mejoras en la comprensión de los objetos visibles y las posibles acciones que los robots deben ejecutar.

En un video reciente, se mostraron robots que manipulan objetos respondiendo a órdenes habladas. Estos robots son capaces de realizar tareas como doblar papel, entregar verduras o colocar objetos con precisión. Además, se presentó un modelo denominado Gemini Robotics-ER, enfocado en la cognición visual y espacial, que está destinado a que otros investigadores lo utilicen para entrenar robots y mejorar su desempeño en diversos escenarios.

Un avance en la interacción humano-robot: el caso del robot Apollo

Un claro ejemplo de las capacidades de Gemini Robotics es el uso de este modelo para controlar el robot Apollo de la startup Apptronik. En una demostración, Apollo conversa con un humano y mueve letras sobre un tablero de mesa de acuerdo con las indicaciones. Este tipo de interacción, que antes parecía sacada de una película de ciencia ficción, es ahora una realidad gracias a la fusión de la IA con la robótica.

Kanishka Rao, investigador de Google DeepMind y líder del proyecto, explicó que el nuevo modelo es capaz de controlar robots en una variedad de escenarios que antes no eran contemplados durante el entrenamiento, haciendo que los robots sean más versátiles y útiles en la vida cotidiana.

Google DeepMind y la evolución de los modelos de robótica

Desde la creación de los modelos de lenguaje grande (LLM), como ChatGPT de OpenAI o el mismo Gemini de Google, la posibilidad de avanzar en la robótica parecía estar cada vez más cerca. Los LLM proporcionan una base sólida para controlar robots, ya que están entrenados con una amplia cantidad de información sobre el mundo físico y son capaces de comunicarse de manera eficaz.

Sin embargo, aunque no es posible recopilar datos de entrenamiento de robots a la misma escala que los LLM, la combinación de estos modelos con métodos de aprendizaje como la teleoperación o la simulación ha permitido que los prototipos robóticos realicen acciones físicas de forma más eficiente. En 2024, Google DeepMind demostró cómo sus robots combinaban estos enfoques para realizar tareas complejas como atarse los zapatos o doblar ropa.

El futuro de los robots: más allá de las tareas simples

Según Rao, el modelo Gemini Robotics es un paso más allá de lo que los investigadores habían logrado anteriormente. Empresas de robótica como Boston Dynamics y Agility Robotics también están explorando nuevas formas de integración de la IA en robots con patas, lo que abre la puerta a una robótica aún más avanzada y compleja.

Google DeepMind ha dejado claro que está trabajando en nuevas capacidades para los robots, que permitirán ejecutar tareas más avanzadas y en situaciones más dinámicas. La inteligencia artificial se está moviendo rápidamente más allá de la simple interacción textual, lo que implica que los robots pueden realizar acciones físicas y comprender el entorno de manera más completa.

Los riesgos de la IA en la robótica y la regulación necesaria

Con el avance de Gemini Robotics y otros modelos similares, también surgen preocupaciones sobre los riesgos de usar IA en robots. En diciembre de 2024, investigadores de la Universidad de Pensilvania demostraron cómo los jailbreaks (desbloqueos de sistema) pueden tener efectos peligrosos al controlar robots. En sus pruebas, un robot con ruedas fue manipulado para realizar acciones inesperadas, como lanzar una “bomba imaginaria”.

Para mitigar estos riesgos, Google DeepMind presentó un nuevo sistema de referencia ética llamado ASIMOV, en honor al escritor de ciencia ficción Isaac Asimov, quien ideó las famosas tres leyes de la robótica. Este sistema está diseñado para evaluar si un robot podría generar comportamientos peligrosos al enfrentarse a diversas situaciones. Según Google, ASIMOV puede ser una herramienta clave para desarrollar regulaciones más complejas y responsables sobre el uso de la IA en robótica.

¿Qué depara el futuro de los robots con IA?

Aunque la tecnología está avanzando rápidamente, Carolina Parada, quien lidera los esfuerzos en robótica de Google, enfatizó que esta tecnología aún está en sus etapas iniciales. Los robots que usan Gemini Robotics aún no aprenden de la misma manera que los humanos, y Google no tiene planes de comercializar esta tecnología en el corto plazo. Sin embargo, el potencial de esta IA en robótica es enorme, y con avances continuos en su desarrollo, podría transformar no solo el ámbito industrial, sino también las interacciones cotidianas con los robots en el futuro cercano.

El lanzamiento de Gemini Robotics marca un hito importante en el desarrollo de la inteligencia artificial aplicada a la robótica, pero aún queda un largo camino por recorrer en términos de seguridad, ética y capacidades. Sin duda, el futuro de los robots humanoides es prometedor, pero también requiere de un enfoque responsable para evitar riesgos y asegurarse de que su integración en la sociedad sea beneficiosa para todos.

Valentina Rodríguez