Gemini Robotics-ER 1.6: Robótica con Razonamiento Mejorado

Avances Clave en el Modelo Gemini Robotics-ER 1.6

El equipo de Google DeepMind ha presentado Gemini Robotics-ER 1.6, un modelo que actúa como el cerebro cognitivo de los robots en entornos reales. Su función principal es analizar el espacio y planificar tareas, ayudando a que los robots tomen decisiones precisas y seguras. Mientras el modelo Gemini Robotics 1.5 se centra en ejecutar los movimientos físicos, Gemini Robotics-ER 1.6 se enfoca en el razonamiento espacial y la detección de éxito al realizar tareas.

Uno de los elementos más destacados es su capacidad para identificar la ubicación exacta de objetos en una imagen, lo que permite desde contar herramientas hasta elegir el punto óptimo para agarrar un objeto. Esto resulta esencial para que un robot actúe con precisión y evite errores costosos, como intentar manipular herramientas que no existen realmente en su entorno. Además, el modelo logra fusionar información de múltiples cámaras, proporcionando una visión coherente incluso en escenarios dinámicos o con obstáculos.

Nuevas Capacidades: Lectura de Instrumentos y Razonamiento Mejorado

El gran avance de Gemini Robotics-ER 1.6 es su novedosa lectura de instrumentos. El modelo es capaz de interpretar medidores analógicos, medidores de presión y visores de nivel en entornos industriales, tareas que suelen requerir mucha precisión y contexto visual. Por ejemplo, ahora puede estimar el nivel exacto de líquido en un visor considerando todos los detalles relevantes del entorno, o leer correctamente los valores en medidores con varias agujas y unidades diferentes.

Durante las pruebas internas, el modelo alcanzó una precisión del 93% en la lectura de instrumentos usando su función “visión agente”, muy por encima del 23% conseguido por versiones anteriores. Este progreso representa un paso fundamental para la autonomía de robots en la supervisión de instalaciones, donde se necesita entender diferentes lecturas y actuar sin intervención constante humana.

Puntos Importantes para la Robótica Autónoma

Gemini Robotics-ER 1.6 es la mente del robot, responsable del análisis espacial, la planificación de tareas y la detección de éxitos, mientras que la acción física queda en manos de otro modelo especializado.
La capacidad de señalar objetos va mucho más allá de detectar su presencia; permite al robot razonar sobre relaciones espaciales, planear trayectorias de movimiento y actuar bajo restricciones complejas.
La lectura de instrumentos es el mayor salto tecnológico, pues brinda a los robots la habilidad de comprender el estado de máquinas y sistemas de manera autónoma en ambientes industriales.
Discriminar cuándo una tarea está realmente completa —el llamado éxito— le da al robot la capacidad de decidir si debe intentar otra vez o avanzar al siguiente paso sin depender de una persona.

Fuente: https://www.marktechpost.com/2026/04/15/google-deepmind-releases-gemini-robotics-er-1-6-bringing-enhanced-embodied-reasoning-and-instrument-reading-to-physical-ai/

25 mayo, 2026 | Startup y PyMEs

El poder oculto tras la inteligencia artificial

El poder concentrado en la era de la inteligencia artificial La aparición de la inteligencia artificial ha puesto bajo la lupa un problema persistente en la historia: la concentración de

22 mayo, 2026 | Startup y PyMEs

Sabotaje digital, optimización y la IA positiva

Sabotaje digital y su impacto en la ciencia Un virus informático llamado fast16.sys, descubierto tras más de 20 años de actividad silenciosa, tenía como objetivo manipular cálculos de alta precisión

20 mayo, 2026 | Startup y PyMEs

Nemotron-Labs-Diffusion: Eficiencia y flexibilidad en IA

Nemotron-Labs-Diffusion: Unificando y Acelerando la Inteligencia Artificial NVIDIA ha presentado Nemotron-Labs-Diffusion, una familia de modelos de lenguaje que introduce una innovación significativa: combina tres métodos de generación de texto diferentes

Powering over 1.5 million websites worldwide

Our set he for firmament morning sixth subdue darkness creeping gathered divide our let god moving.

+10 378 267 3782