El pensamiento múltiple de las IA y los desafíos del diseño de chips
¿Cómo razonan los modelos de lenguaje? Nuevas investigaciones revelan que los modelos de lenguaje avanzados desarrollan múltiples «personalidades» internas para responder preguntas difíciles. En vez de seguir un solo razonamiento, estas inteligencias artificiales simulan una especie de debate entre diferentes puntos de vista, evaluando alternativas y hasta exponiendo desacuerdos internos antes de llegar a una solución. Por ejemplo, en problemas de química o redacción creativa, distintos «personajes internos» proponen enfoques, critican propuestas y resuelven conflictos, como si hubiera una pequeña sociedad debatiendo dentro del modelo. Este proceso no sólo permite respuestas más ricas, sino que muestra que las IA ahora simulan modelos de mundo más complejos para abordar tareas difíciles.
Desafíos reales en el diseño de chips con IA Aunque la inteligencia artificial ha mostrado avances impresionantes, el diseño de chips sigue siendo un reto considerable para estas tecnologías. El nuevo benchmark ChipBench evalúa a las IA en escritura y depuración de código Verilog, así como en la generación de modelos de referencia. Los resultados demuestran que, incluso los modelos más avanzados como GPT y Gemini, aún tienen dificultades para desempeñarse en tareas de diseño de chips de la vida real; las tasas de éxito no superan el 50% incluso en las mejores categorías. El problema va más allá de la sintaxis: diseñar chips es una tarea compleja y llena de matices, donde los errores pueden ser costosos y los ejemplos del mundo real son mucho más extensos y desafiantes que los típicos benchs de laboratorio.
Avances en matemáticas y hardware con IA
El uso de IA en investigación matemática fue probado al atacar los conocidos problemas de Erdős. Un modelo basado en Gemini generó cientos de posibles soluciones, pero rápidamente se observa una realidad: sólo unas pocas respuestas sobrevivieron a la revisión de expertos, y de esas, aún menos resultaron ser novedosas o significativas. Este fenómeno pone en evidencia que aunque la IA puede acelerar la producción de hipótesis, la revisión humana sigue siendo esencial para validar y filtrar resultados. A futuro, la colaboración entre humanos y máquinas será clave, especialmente para tareas que requieren intuición y comprensión profunda.
En paralelo, Huawei y la universidad de Nanjing han usado IA para automatizar la creación de núcleos para sus chips AscendC. Utilizando un software llamado AscendCraft, la IA genera programas de alto nivel que luego se traducen a código especializado para los chips de Huawei. El resultado: casi el 100% de los núcleos generados se compilan con éxito, y cerca de la mitad igualan o superan el rendimiento de soluciones manuales. Aunque todavía no es perfecto, muestra el potencial de la IA para fortalecer la innovación en hardware, incluso en plataformas poco documentadas.