¿Qué es la inteligencia realmente general?
La inteligencia artificial general (AGI) no debe reducirse solo a unir diferentes habilidades tecnológicas, como el lenguaje y la visión. Para que una inteligencia sea verdaderamente general, debe comprender y actuar en el mundo físico, abordando tareas como reparar objetos o preparar alimentos; desafíos que van mucho más allá de manipular símbolos o palabras. Los sistemas actuales, como los modelos de lenguaje, parecen entender el mundo gracias a su destreza con el texto, pero en realidad solo recorren grandes cantidades de datos y aprenden patrones superficiales.
Por ejemplo, un modelo puede jugar bien al ajedrez o al Othello porque esas actividades son esencialmente reglas simbólicas. Sin embargo, ninguna cantidad de simbolismo puede reemplazar la comprensión física necesaria para, por ejemplo, limpiar una habitación. La diferencia central entre los humanos y las máquinas actuales radica en que los humanos basan su inteligencia en la experiencia corporal y la interacción directa con su entorno. Los algoritmos no tienen esa vivencia y, por tanto, no pueden entender realmente el mundo más allá de lo que describimos con palabras.
Más allá de modelos e intuiciones técnicas
Algunos creen que sólo escalar los modelos actuales terminará generando AGI. Pero esa estrategia enfrenta serios límites. Las capacidades plurales, como el lenguaje, la visión y la acción física, no se desarrollan simplemente colocando todos los conocimientos en una sola gran red matemática. Cuando intentamos hacer esto, terminamos con estructuras complejas y artificialmente separadas: por ejemplo, el texto y las imágenes viven en «espacios» diferentes y no se entienden entre sí con plenitud.
El éxito de los grandes modelos de lenguaje y visión se debió principalmente a la cantidad de datos y potencia computacional —no a una eficiencia comparable con la inteligencia real. Ellos imitan, no inventan. Los humanos, por el contrario, somos capaces de crear conceptos nuevos con muy pocos ejemplos y adaptar nuestra comprensión del mundo a situaciones novedosas. La habilidad para fusionar información de distintas fuentes y elaborar soluciones creativas es lo que define a la inteligencia general, y esto no surge solo por combinar muchas «modalidades» en una inteligencia artificial.
Hacia una inteligencia más auténtica
Si queremos llegar a una auténtica AGI, debemos dejar de juntar sistemas específicos como piezas de Frankenstein. En vez de forzar secciones especializadas (como visión o lenguaje) a colaborar, debemos diseñar modelos donde la separación entre modalidades desaparezca y el procesamiento integral emerja de la interacción con el entorno. Imagina una máquina que pueda aprender observando, actuando y comunicando, todo mediante los mismos procesos cognitivos.
Esto implica que la estructura de una inteligencia no debe depender de cómo los humanos hemos dividido tradicionalmente la información (en imágenes, texto, acciones), sino permitir que los sistemas descubran por sí mismos cómo integrar y utilizar la información en su totalidad. Aunque este enfoque podría ser menos eficiente al principio, a largo plazo permitirá una flexibilidad y creatividad mucho mayores que los modelos ultra-especializados y desconectados de la realidad física.