MEM: Revolucionando la Memoria de los Robots
En los desafíos más complejos, como limpiar una cocina o seguir recetas extensas, los robots requieren más que simples órdenes. La nueva tecnología Multi-Scale Embodied Memory (MEM) dota a los robots de una memoria avanzada que equilibra la comprensión del contexto con la capacidad de reaccionar en tiempo real.
Cómo Funciona la Nueva Memoria Inteligente
MEM utiliza dos tipos de memoria en simultáneo. La memoria de corto plazo permite a los robots procesar información visual reciente y adaptarse a entornos cambiantes, como variar la forma de agarrar objetos según la situación. Esto se consigue mediante un procesamiento de video ultrarrápido capaz de analizar hasta 16 imágenes en apenas un minuto, una mejora crucial para tareas delicadas.
Por otro lado, la memoria de largo plazo sintetiza eventos clave en resúmenes de lenguaje. Así, en vez de memorizar cada detalle, el robot recuerda lo esencial en formatos como “coloqué tres tazones”, volviendo su comportamiento más eficiente y menos propenso a errores. Esta combinación le permite organizar y comprender sus acciones a lo largo de hasta 15 minutos, algo antes imposible para modelos tradicionales.
Resultados: Robots Más Eficientes y Autónomos
La integración de MEM en robótica se hizo utilizando el poderoso modelo Gemma 3-4B como base, mejorado con enseñanzas de tareas del mundo real y millones de imágenes y videos. ¿El resultado? Mejoras tangibles: los robots adaptan sus estrategias si fallan, incrementando su éxito en tareas específicas (por ejemplo, abriendo heladeras desconocidas un 62% más de las veces y recogiendo palillos chinos con un 11% más de aciertos).
Además, la capacidad de sostener el contexto durante más tiempo les permite completar trabajos prolongados como limpiar cocinas o seguir recetas complejas sin perderse ni cometer fallos tontos. Donde modelos anteriores fallaban, MEM garantiza constancia y eficiencia. Todo esto sin sacrificar velocidad: la arquitectura asegura que los robots puedan pensar “a largo plazo” sin sobrecargar los recursos computacionales.