IA Responsable: Reglas Claras para un Futuro Seguro

¿Por qué necesitamos reglas claras para la inteligencia artificial?

El avance de los modelos de lenguaje de inteligencia artificial presenta grandes oportunidades y desafíos, especialmente a medida que se introducen en áreas críticas como la salud, las finanzas y la educación. Sin una supervisión adecuada, estos sistemas pueden caer en comportamientos no deseados o arrojar resultados erróneos y dañinos. Por eso, cada vez es más necesario instalar mecanismos de control que aseguren que la inteligencia artificial siga valores humanos, normas éticas y legislaciones vigentes. En los últimos años, se ha registrado un aumento marcado de incidentes relacionados con IA, lo que resalta la importancia de construir sistemas fiables. Diversos organismos, desde agencias estatales hasta grupos internacionales como la UNESCO, están generando regulaciones y guías éticas para que la inteligencia artificial sea útil y segura, pero su implementación eficaz sigue siendo un desafío constante.

Cómo protegernos de los riesgos: claves para una IA confiable

Las reglas de control en IA abarcan más que simples filtros de salida. Incluyen auditorías de datos, monitoreos en tiempo real y revisiones continuas durante el desarrollo y uso de los sistemas. Los controles pueden implementarse en distintas etapas:

  • Antes del despliegue: Revisar y auditar los datos y simular situaciones de riesgo antes de poner la IA al servicio de los usuarios.
  • Durante el entrenamiento: Usar estrategias donde personas supervisan cómo aprende la IA, evitar que ciertos sesgos se repitan y asegurar que la privacidad se respete siempre.
  • Después del despliegue: Moderar las respuestas, monitorear los resultados constantemente y evaluar si la IA sigue cumpliendo su función sin causar daños.

Para que estos controles sean efectivos, es fundamental que la IA sea robusta, capaz de explicar sus decisiones, mantener la privacidad, rendir cuentas por sus acciones y actuar de manera justa. Ninguna medida aislada basta: solo la combinación de estas prácticas puede llevar a una inteligencia artificial verdaderamente ética y confiable.

Desafíos y futuro de la IA responsable

Desarrollar IA confiable implica enfrentar desafíos complejos. Es difícil definir qué es «dañino» o «justo» según cada contexto cultural o social, y muchas veces, si se imponen controles demasiado estrictos, la utilidad de la IA se reduce drásticamente. Además, supervisar manualmente miles de interacciones cada día es costoso y difícil de escalar, mientras que el funcionamiento interno de los modelos sigue siendo opaco y complicado de entender. Los estudios han demostrado que un exceso de restricciones genera respuestas poco útiles o bloqueos innecesarios. Por este motivo, la evaluación constante y el feedback de los usuarios deben estar en el centro de toda política de gobernanza en IA.

El futuro de la inteligencia artificial responsable depende de diseñar sistemas desde cero pensando en la seguridad y la transparencia, con revisiones periódicas, adaptabilidad y un profundo respeto por las personas. Solo así la sociedad podrá confiar en que la IA será una aliada, y no un peligro inesperado.


fuente: https://www.marktechpost.com/2025/07/23/ai-guardrails-and-trustworthy-llm-evaluation-building-responsible-ai-systems/

Avances en IA: Seguridad, Personalidad y Regulación

Avances en Inteligencia Artificial: Seguridad, Estrategias y Regulación

Sistemas de pentesting autónomos superan a los humanos
Una startup de seguridad llamada XBOW ha alcanzado el primer puesto en la plataforma HackerOne gracias a un sistema de pentesting (pruebas de seguridad) completamente automatizado. Este agente de IA realiza pruebas exhaustivas en pocas horas y no requiere intervención humana. Su desempeño ha demostrado que es capaz de identificar todo tipo de vulnerabilidades, como ejecución remota de código, inyecciones SQL, exposición de secretos y más, igualando o superando la tasa de hallazgos de expertos humanos.

La relevancia de esto radica en que la seguridad informática podría cambiar radicalmente en los próximos años: la llegada de agentes de IA expertos tanto en ataque como en defensa podría modificar el equilibrio actual. Estos resultados iniciales muestran que ya es posible desarrollar sistemas capaces de competir con profesionales en un área tan compleja como la ciberseguridad.

Las personalidades de las IAs al descubierto: El dilema del prisionero

Investigadores del King’s College de Londres y la Universidad de Oxford han analizado cómo distintos sistemas de IA enfrentan juegos inspirados en el dilema del prisionero, un conocido problema de teoría de juegos que estudia la cooperación y la competencia. Para ello, pusieron a competir modelos de Google, OpenAI y Anthropic en torneos de miles de rondas, observando sus decisiones y estrategias.

El estudio revela que, aunque todos los modelos son competitivos, cada IA desarrolla un “estilo” propio: Gemini (Google) es estratégicamente implacable y aprovecha la cooperación ajena; los modelos de OpenAI tienden a ser cooperativos (aunque eso los perjudica en entornos hostiles); mientras que Claude (Anthropic) es el más permisivo, dispuesto a restaurar la cooperación incluso tras una traición.

Este tipo de investigaciones sugiere que las IA están generando un ecosistema digital con “especies” distintas, cada una con sus propias características y comportamientos. Si bien su capacidad cognitiva básica es similar, la personalidad y estilo de cada modelo puede diferenciar claramente su accionar en situaciones de colaboración o conflicto, marcando la forma en que interactuarán en el mundo real.

Nuevos desafíos en matemáticas y propuestas regulatorias

El organismo Epoch AI ha presentado un nuevo conjunto de problemas matemáticos, llamado FrontierMath Tier 4, diseñado para evaluar los límites de razonamiento de las IA de última generación. Las pruebas, calificadas como extremadamente difíciles por matemáticos profesionales, muestran que los mejores sistemas actuales apenas logran resolver una pequeña fracción de los retos. De hecho, en las pruebas recientes, sólo se han resuelto satisfactoriamente tres de las cincuenta preguntas propuestas, y en esos casos, la IA simplificó el problema mediante supuestos no justificados.

Esto demuestra que los retos verdaderamente complejos y originales aún superan las capacidades actuales de la IA. Sin embargo, a medida que estas barreras se superen, pronto llegaremos a un punto donde será difícil, incluso para expertos humanos, evaluar si las respuestas de una IA a un problema inédito son correctas. El avance de la IA en estas áreas podría conducirnos a un escenario donde sólo unos pocos tienen la capacidad de comprender y verificar los resultados generados por estas máquinas.

Ante el impacto de estos avances, surge la pregunta de cómo regular el desarrollo de la IA. Algunos expertos proponen dirigir la regulación hacia las grandes empresas que lideran la creación de tecnologías avanzadas, en vez de centrarse únicamente en casos de uso o características técnicas de cada modelo. El objetivo sería exigir mayor transparencia e información pública sobre las actividades y riesgos potenciales derivados del desarrollo de IA en el “frontera tecnológica”. Así, la sociedad y los gobiernos tendrían más herramientas para anticipar y reaccionar ante la aparición de capacidades novedosas y riesgos asociados.


Fuente: https://jack-clark.net/2025/07/14/import-ai-420-prisoner-dilemma-ai-frontiermath-tier-4-and-how-to-regulate-ai-companies/

La Comunicación Emergente en la IA: Sin Sobrecarga ni Ayudas Artificiales

Comunicación Emergente sin Sobrecarga Artificial en la Inteligencia Artificial

En el campo de la inteligencia artificial descentralizada, enseñar a las máquinas a comunicarse ha sido un desafío debido a lo que se conoce como el “dilema de exploración conjunta”. Este problema muchas veces lleva a que los agentes no logren desarrollar una comunicación efectiva, cayendo en una especie de “vacío comunicativo”. Tradicionalmente, para resolver esto, se ha recurrido a reglas o ayudas externas que faciliten la aparición de comunicación entre sistemas de inteligencia artificial. Sin embargo, esta investigación plantea si realmente es necesario agregar esas ayudas o si, en realidad, se está complicando de más el proceso.

Se utilizó un marco experimental llamado “AI Mother Tongue” (AIM), basado en un enfoque que permite a las máquinas crear y usar sus propios símbolos. Los resultados mostraron que, cuando los agentes cuentan con un sistema de símbolos propio, sus “pensamientos” internos tienden a organizarse de manera natural y eficiente. Así, logran desarrollar una comunicación simbólica útil sin depender de reglas externas. Este fenómeno tiene paralelismos con investigaciones de neurociencia que sugieren que el cerebro humano tampoco usa el lenguaje humano tradicional para razonar internamente. Además, este avance está en sintonía con nuevos estudios sobre las capacidades de ciertas inteligencias artificiales, como los modelos de lenguaje modernos.


Ventajas y Descubrimientos Clave

El método AIM logró que las máquinas se comuniquen de manera más general y eficaz que los métodos tradicionales, que requieren reglas muy explícitas. Un conjunto de herramientas analíticas desarrollado en este trabajo permitió entender mejor cómo surgen y se usan los símbolos creados por las inteligencias artificiales, mostrando que la utilización de estos símbolos sigue una distribución natural y predecible.

A partir de este descubrimiento, se proponen tres principios teóricos fundamentales:

  • Hipótesis de Comunicación Neural: Sugiere que el proceso comunicativo puede surgir desde las propias representaciones internas de los sistemas, sin necesidad de ayudas externas.
  • Principio de la Herramienta Primero: Indica que los símbolos y herramientas de comunicación aparecen de forma espontánea como una forma de optimizar las tareas, en vez de ser impuestos artificialmente.
  • Paradigma de Interpretabilidad Semántica: Plantea que la comunicación emergente es, a su vez, interpretable y significativa hacia quienes la usan.

Perspectivas Futuras e Implicancias

Los resultados de esta investigación abren la puerta a integrar enfoques más avanzados, como sistemas jerárquicos de símbolos, que permitirían aún mayor riqueza en la comunicación entre máquinas. Además, consideran importante explorar el uso de grandes sistemas de inteligencia artificial para pre-entrenar capacidades básicas, facilitando aún más el aprendizaje autónomo de comunicación.

Este avance representa una oportunidad para juntar lo mejor de dos mundos en inteligencia artificial: el uso de símbolos y reglas (simbolismo) y el aprendizaje mediante redes neuronales (conexionismo), todo sin sobrecargar a las máquinas con supuestos innecesarios o reglas rígidas. Se trata de un paso importante para entender cómo pueden comunicarse las máquinas de manera más “humana” y eficiente, partiendo desde su lógica interna.


Fuente: https://arxiv.org/abs/2507.10566

LFM2: La Nueva Generación de IA en Dispositivos

Avances en el rendimiento y la eficiencia para la Inteligencia Artificial en dispositivos

La nueva generación de modelos de Inteligencia Artificial (IA) generativa desarrollada por Liquid AI, conocida como LFM2, representa un gran paso adelante en el uso de IA directamente en dispositivos como teléfonos, computadoras portátiles, autos y relojes inteligentes. Estos modelos ofrecen una velocidad de respuesta hasta dos veces mayor en comparación con otras soluciones actuales, y además permiten entrenar sistemas similares tres veces más rápido que generaciones anteriores. Esto convierte a LFM2 en una de las opciones más económicas y accesibles para quienes buscan implementar AI potente en equipos con recursos limitados.

Estas mejoras no son menores; facilitan que la IA funcione en tiempo real, incluso sin conexión a internet, lo que garantiza privacidad y velocidad. Esto resulta clave en áreas donde la información debe ser procesada de manera inmediata y segura, como la electrónica de consumo, la robótica, los sistemas financieros y el sector educativo.


Innovación en arquitectura y entrenamiento

LFM2 se apoya en una arquitectura innovadora que combina las ventajas de diferentes métodos de procesamiento para maximizar la eficiencia. Distribuido en tres tamaños (350 millones, 700 millones y 1.200 millones de parámetros), cada modelo está optimizado para distintos tipos de dispositivos y aplicaciones, pero siempre manteniendo la agilidad y la capacidad para responder rápido.

La base de entrenamiento de LFM2 usó una enorme cantidad de datos cuidadosamente seleccionados —10 billones de textos en su corpus, incluyendo información en múltiples idiomas y código informático. Para garantizar su calidad, se empleó una técnica donde el nuevo modelo aprende de uno anterior (LFM1-7B), mejorando su precisión y capacidad al absorber el conocimiento ya adquirido.

Gracias a estas características, los modelos LFM2 pueden comprender secuencias de texto mucho más extensas y responder eficientemente a una variedad de tareas, desde recordar datos hasta razonar y entender instrucciones complejas.


Desempeño líder y despliegue flexible

Las evaluaciones realizadas demuestran que LFM2 supera claramente a otros modelos de su tamaño en diferentes pruebas, ofreciendo mejores respuestas y mayor velocidad, incluso en conversaciones de varias preguntas y respuestas. La alternativa de menor tamaño iguala o supera el rendimiento de modelos más grandes y populares del mercado, al tiempo que consume menos recursos.

Además, LFM2 es extremadamente versátil para su uso en distintos dispositivos, desde teléfonos de alta gama hasta procesadores convencionales. Su tecnología permite que la IA se ejecute de manera eficiente en distintos entornos y plataformas, sin depender del procesamiento en la nube, lo que reduce costos y protege la privacidad del usuario.

Esta capacidad de optimización para el despliegue local marca un hito para la integración de la inteligencia artificial en una gama cada vez más amplia de aplicaciones y productos cotidianos, impulsando así una adopción creciente de soluciones inteligentes fuera del entorno tradicional de los grandes centros de datos.


Fuente: https://www.marktechpost.com/2025/07/13/liquid-ai-open-sources-lfm2-a-new-generation-of-edge-llms/

Avances de Inteligencia Artificial en Diversos Campos

Vigilancia mediante Inteligencia Artificial y Escalabilidad del Autoritarismo

La capacidad de rastrear múltiples personas en situaciones de multitudes ha avanzado significativamente gracias al desarrollo de datos y herramientas como CrowdTrack, una base de datos con 40,000 imágenes y más de 700 mil anotaciones extraídas de 33 videos de ambientes cotidianos y sitios de construcción. Estos escenarios presentan desafíos únicos para la identificación, ya que la ropa y los cascos de los trabajadores dificultan distinguir rostros, lo que obliga a los sistemas de IA a enfocarse en la forma de caminar y la silueta corporal.

El impacto de este avance radica en el abaratamiento y la facilidad para realizar una vigilancia a gran escala. Anteriormente, construir sistemas de vigilancia masiva era costoso y complejo, pero ahora la inteligencia artificial reduce significativamente esa barrera. Modelos y bases de datos como CrowdTrack permiten realizar tareas como identificación visual, análisis de movimiento y extracción de características, marcando una nueva etapa en la capacidad de los gobiernos o instituciones para implementar sistemas de seguimiento poblacional amplios y, potencialmente, autoritarios.

Este enfoque, aunque útil para diversos fines, también plantea interrogantes sobre privacidad, control social y el equilibrio entre tecnología y derechos ciudadanos.

Robótica a Escala y Automatización en Amazon

Amazon ha superado un hito al desplegar su robot número un millón en sus centros logísticos, consolidándose como el operador más grande de robots móviles del mundo. Estos robots, parecidos a discos móviles, se encargan principalmente de mover estantes, aunque la empresa también explora robots para bandas transportadoras y tareas de selección y colocación.

Para mejorar la eficiencia, Amazon desarrolló DeepFleet, un programa inteligente que coordina el movimiento de los robots. Este sistema ha logrado reducir el tiempo de traslado de los robots en un 10%, optimizando rutas y disminuyendo la congestión dentro de los almacenes, lo que agiliza el procesamiento de los pedidos.

El avance en robótica permite imaginar escenarios futuros en los que toda la infraestructura logística pueda funcionar de manera autónoma, incluso bajo la supervisión de inteligencias artificiales aún más avanzadas. Este tipo de desarrollo representa pasos concretos hacia una automatización total en la industria, con potenciales aplicaciones más allá del comercio y el almacenamiento.

Nuevas Fronteras en Juegos y Diseño de Proteínas con IA

Se están produciendo avances revolucionarios en el uso de IA para el entretenimiento y la biotecnología. Dynamic Labs ha presentado Mirage, un motor generativo capaz de crear videojuegos infinitos y personalizados, en tiempo real, a partir de inteligencia artificial. Aunque todavía presenta limitaciones, estas tecnologías prometen transformar el concepto de los videojuegos, generando universos virtuales inagotables y experiencias únicas para cada jugador.

Por otro lado, el diseño de proteínas también está cambiando gracias a modelos generativos como Chai-2, capaces de diseñar anticuerpos completamente nuevos con una tasa de éxito sustancialmente mayor que las técnicas anteriores. En pruebas, Chai-2 logró, en menos de dos semanas, diseñar y validar en laboratorio anticuerpos eficaces para la mitad de los objetivos planteados, todo sin referencias previas en bases de datos. Este avance señala una nueva era en el descubrimiento de medicamentos y en la investigación biomédica, donde la creación de moléculas de precisión ya es una realidad práctica.


Fuente: https://jack-clark.net/2025/07/07/import-ai-419-amazons-millionth-robot-crowdtrack-and-infinite-games/

El mito de los modelos multimodales en la Inteligencia Artificial General

Inteligencia artificial general: ¿Por qué no basta con modelos multimodales?

En los últimos años, los modelos de inteligencia artificial han mostrado avances sorprendentes, dando lugar a la creencia de que estamos cerca de alcanzar una Inteligencia Artificial General (AGI). Sin embargo, estos modelos, entrenados principalmente para reconocer patrones y predecir secuencias de texto o imágenes, no necesariamente alcanzan una comprensión genuina del mundo. Su capacidad se debe más a la escala y la cantidad de datos procesados que a una solución profunda sobre cómo funciona la inteligencia.

Actualmente, la estrategia más popular para avanzar hacia la AGI consiste en unir sistemas que dominan diferentes modalidades (texto, imágenes, acciones físicas) y combinarlos para simular una inteligencia general. Sin embargo, existen dificultades importantes en este enfoque, que impedirán que se alcance una verdadera inteligencia similar a la humana. Las principales limitaciones son:

  • Falta de comprensión física del mundo: Muchos problemas reales, como reparar un objeto o preparar alimentos, requieren una experiencia situada, más allá de la manipulación simbólica de datos.
  • Conocimiento superficial: Los modelos actuales aprenden a predecir datos siguiendo reglas abstractas sobre secuencias, sin generar una comprensión genuina de la realidad que representan esos datos. Suelen memorizar patrones y desarrollar “aboliciones inteligentes” que no equivalen a una verdadera semántica o comprensión.
  • Limitaciones pragmáticas: Mientras los humanos interpretan el contexto físico y social para entender el lenguaje, los modelos carecen de este tipo de razonamiento, lo que afecta su capacidad para responder adecuadamente en situaciones cotidianas.

Un ejemplo revelador es el resultado de modelos capaces de predecir el desarrollo de un juego de mesa a partir de secuencias de movimientos. Si bien logran reconstruir el estado del juego, en tareas vinculadas al mundo físico no pueden inferir el estado real de un entorno mediante descripciones textuales, ya que esto exige una comprensión concreta del espacio y las relaciones físicas, algo que los modelos actuales no experimentan.

La aparente habilidad “humana” de los modelos lingüísticos para comprender no surge de un modelo interno del mundo, sino de una sofisticada habilidad para manipular símbolos y patrones. Así, pueden generar frases correctas gramaticalmente, pero con sentido nulo, o responder preguntas de forma semánticamente incorrecta. La comprensión humana, en cambio, nace de la interacción física y social constante con el entorno, una característica que los modelos actuales no poseen.

Por tanto, confundir éxito en lenguaje con inteligencia general es un error. Los humanos interpretan el lenguaje gracias a múltiples facultades cognitivas integradas: sintaxis, semántica y pragmática. Los sistemas actuales tienden a imitar sólo la estructura superficial (la sintaxis), sin alcanzar profundidad conceptual.

El desafío de la escala y el mito de unir modelos multimodales

Durante años, los avances en inteligencia artificial han sido impulsados por el aumento de la escala (más datos, más cómputo) antes que por una mayor eficiencia o comprensión profunda. Hay una tendencia a pensar que, escalando los actuales modelos, aparecerá espontáneamente la inteligencia general. Sin embargo, este método tiene límites claros.

Intentar sumar modelos expertos en dominios limitados (por ejemplo, modelos expertos en texto con modelos expertos en imágenes) no produce una inteligencia sintética coherente comparable a la humana. Existen obstáculos fundamentales:

  • Separación artificial de modalidades: En los humanos, leer, ver, hablar y actuar están mediados por estructuras cognitivas que se superponen. Es artificial e ineficiente diseñar sistemas donde cada modalidad (por ejemplo, imagen o texto) tenga su propio procesador independiente.
  • Interconexión de los conceptos: La integración de sentidos y acciones requiere unir información a diferentes niveles de abstracción, algo mucho más complejo que “alinear” vectores o unir módulos entrenados por separado.
  • Falta de flexibilidad conceptual: Los modelos actuales entrenan para replicar los conceptos ya desarrollados y refinados por la humanidad, en lugar de desarrollar la capacidad de generar nuevos conceptos a partir de la experiencia. La habilidad humana para inventar ideas y generalizar a partir de pocos ejemplos no se replica por escalar modelos existentes.

Además, optimizar modelos para copiar el resultado final de la inteligencia humana (sus conceptos ya formados) ignora la cuestión fundamental de cómo estos conceptos surgen y evolucionan. Los sistemas “multimodales” actuales no favorecen el desarrollo de una inteligencia capaz de adaptarse y responder a situaciones novedosas.

Por último, el intento de unir modelos entrenados en distintos dominios resulta en una “fragmentación” conceptual: cada modalidad desarrolla su propia idea de significado, lo que impide crear una verdadera comprensión conjunta del mundo. El significado no reside en la unión superficial de representaciones, sino en la capacidad de compartir y reformular información de manera coherente en cualquier situación.

El camino hacia una inteligencia artificial general verdaderamente flexible

La promesa de construir una AGI uniendo modelos de distintas modalidades (texto, imagen, acción) es, por ahora, una ilusión. Para alcanzar una inteligencia completa y flexible, es necesario replantear la interacción entre los sistemas de percepción y acción.

Una alternativa es tratar las modalidades no como entidades separadas, sino como manifestaciones emergentes de un proceso cognitivo principal, acompañado de interacción y aprendizaje con el entorno. Esto implica diseñar sistemas donde la percepción (ya sea imágenes, texto o video) se procese de forma uniforme, y donde las acciones resultantes (como escribir, manipular objetos o navegar) se produzcan desde un mecanismo común.

Si bien esto puede reducir la eficiencia en tareas especializadas, el resultado sería una capacidad cognitiva más flexible y adaptable, cercana a la forma en la que los humanos crecemos, aprendemos y resolvemos problemas en un mundo físico.

En síntesis, el reto no es sólo matemático (ya contamos con poderosas técnicas de aproximación de funciones) sino principalmente conceptual: identificar las funciones y procesos que necesitamos y cómo disponerlos de forma que produzcan una inteligencia general y coherente.


Fuente: https://thegradient.pub/agi-is-not-multimodal/

Desafíos y avances en razonamiento infinito con marcos de argumentación

Modelando el razonamiento y el conflicto

En el campo de la inteligencia artificial, los marcos de argumentación son una herramienta clave para comprender y analizar cómo las ideas pueden entrar en conflicto y cómo se puede razonar a partir de ellas. Estos marcos permiten organizar y descomponer el proceso de evaluación de argumentos y objeciones en partes más pequeñas y manejables. Una de las formas más utilizadas para descomponer este proceso se basa en analizar los componentes más conectados del sistema, siguiendo un enfoque progresivo desde los elementos más generales hasta los más específicos.

Desafíos al trabajar con dominios infinitos

En sistemas limitados, estos métodos han demostrado ser efectivos para evaluar y resolver debates entre argumentos opuestos. Sin embargo, cuando intentamos aplicar estos mismos principios en situaciones donde los elementos pueden ser infinitos —por ejemplo, en dominios o discusiones que nunca terminan—, surgen dificultades. En particular, surgen problemas relacionados con la ausencia de un punto de inicio claro para el proceso lógico. Como resultado, los enfoques tradicionales pueden dejar de funcionar correctamente y no ofrecen garantías de obtener una solución bien definida.

Frente a estos desafíos, proponemos dos nuevas estrategias para adaptar la descomposición y análisis de argumentos en escenarios infinitos. Estas alternativas fueron evaluadas sistemáticamente mediante criterios reconocidos para determinar si mantienen propiedades fundamentales de los sistemas de razonamiento. Uno de los resultados más interesantes es observar que ciertas propiedades deseables, como la capacidad de analizar partes independientes del sistema sin que se afecten mutuamente, no siempre se conservan en el caso general.

Avances y nuevos caminos para sistemas inteligentes

Al aplicar estas nuevas estrategias en marcos donde los conflictos siguen siendo finitos —aunque el sistema pueda potencialmente crecer sin límite—, observamos que en algunos casos las propiedades originales se preservan. Esto demuestra que es posible diseñar sistemas capaces de manejar razonamientos complejos y extensos, incluso en situaciones donde la información es ilimitada o está en constante evolución.

Estos avances fortalecen la teoría de la argumentación en contextos amplios y sientan las bases para el desarrollo de herramientas y sistemas de razonamiento inteligentes, capaces de adaptarse y responder en escenarios dinámicos y sin restricciones establecidas de antemano.


Fuente: https://arxiv.org/abs/2507.06852

GitHub Copilot Chat: La herramienta de IA gratuita para VS Code

Características principales de GitHub Copilot Chat para VS Code

Microsoft ha decidido liberar y hacer gratuito el complemento GitHub Copilot Chat para Visual Studio Code, permitiendo que todos los desarrolladores accedan a sus herramientas de asistencia de código basadas en inteligencia artificial. Bajo la licencia MIT, este avance ofrece mayor transparencia y posibilidades de personalización en el entorno de programación.

El complemento incluye cuatro componentes clave que trabajan juntos para mejorar la experiencia de desarrollo:

  • Agent Mode: Automatiza tareas de programación complejas, como diagnosticar errores, ejecutar pruebas y corregir fallos de manera autónoma. Por ejemplo, puede encargarse de implementar una capa de caché dividiendo el proceso en subtareas sin intervención manual.
  • Edit Mode: Permite realizar ediciones en múltiples archivos usando comandos en lenguaje natural. Con instrucciones simples como “Agrega registros a todas las solicitudes HTTP”, el sistema actualiza todo el proyecto, mostrando un avance en vivo de los cambios antes de aplicarlos.
  • Code Suggestions: Ofrece completaciones predictivas de código que entienden el contexto del proyecto y el estilo del programador, sugiriendo las siguientes acciones más razonables para avanzar de manera fluida en la escritura y refactorización de código.
  • Chat Integration: Brinda un chat integrado en el editor que responde preguntas específicas del código, como “¿Por qué falla esta prueba?” u “¿Qué hace esta función?”, utilizando el propio contenido del proyecto. Esto facilita la documentación y el soporte en tiempo real sin dejar Visual Studio Code.

Ventajas para la comunidad de desarrolladores

La liberación de Copilot Chat bajo una licencia abierta aporta importantes beneficios. Las empresas y usuarios pueden ahora autoalojar y personalizar la extensión según sus propias necesidades, incluso en entornos con restricciones o proyectos privados. Además, se fomenta la colaboración y mejora continua gracias a las aportaciones de la comunidad, quienes pueden contribuir con nuevas funciones o mejoras de rendimiento.

Este cambio también favorece a estudiantes y desarrolladores en entornos educativos o con bajos recursos, al eliminar la barrera económica de la suscripción y democratizar el acceso a herramientas modernas y avanzadas de IA para la programación.

Impacto en la experiencia de desarrollo

Al ofrecer funciones avanzadas sin costo, Microsoft transforma la manera de trabajar con código en Visual Studio Code. Herramientas que antes eran exclusivas para usuarios pagos ahora están disponibles para todo el mundo, mejorando la productividad y la colaboración.

Con la integración de Agent Mode, Edit Mode, Code Suggestions y el chat contextual, la experiencia de desarrollo se vuelve más rápida e inteligente, permitiendo resolver problemas y avanzar en los proyectos de forma eficiente y sencilla.


Fuente: https://www.marktechpost.com/2025/07/09/microsoft-open-sources-github-copilot-chat-extension-for-vs-code-now-free-for-all-developers/

El verdadero desafío de la AGI: integrando percepción, acción y razonamiento

¿Qué es la Inteligencia Artificial General y por qué no basta con sumar modalidades?

Muchas personas piensan que si un sistema de inteligencia artificial puede manejar varios tipos de información—como texto, imágenes y acciones—y unirlos en un solo modelo, entonces estamos muy cerca de lograr una Inteligencia Artificial General (AGI). Sin embargo, esto es un error. Un AGI auténtico no solo debe comprender y procesar símbolos o palabras, sino que también debe actuar con sentido común en el mundo físico. Tareas como reparar un auto, preparar comida o resolver problemas prácticos requieren una comprensión mucho más profunda de la realidad, que va más allá de la manipulación de palabras o imágenes.

Hoy, los modelos de lenguaje avanzados como los LLMs (grandes modelos de lenguaje) parecen muy inteligentes porque pueden predecir la siguiente palabra de un texto con gran acierto. Algunos afirman que estos modelos desarrollan un “modelo del mundo”, una representación interna de cómo funciona la realidad. Sin embargo, en la práctica, estos sistemas suelen aprender reglas y patrones lingüísticos superficiales, no una comprensión real del mundo físico. Por ejemplo, pueden aprender que ciertas palabras suelen ir juntas, pero esto no significa que realmente comprendan el significado profundo detrás de esas palabras o frases.

Esta diferencia se vuelve evidente con ejemplos simples. Los humanos, al escuchar una frase como «El refrigerador está dentro de la manzana», reconocen de inmediato que es absurda porque saben que un refrigerador es más grande que una manzana. Los modelos, en cambio, podrían validar la frase si han visto patrones similares, aunque carezcan de sentido físico o práctico. Comprender la realidad implica mucho más que identificar patrones en grandes volúmenes de texto e imágenes.

Un desafío clave es que muchos modelos actuales intentan unir diferentes tipos de información («modalidades») como si fueran bloques independientes que solo hay que pegar. Pero la inteligencia humana no funciona así. Nuestras percepciones, acciones y razonamientos están completamente entrelazados. Por ejemplo, al leer un cartel o escuchar una instrucción, los humanos integran lo visual, lo auditivo y sus experiencias previas en una sola interpretación coherente para luego actuar de manera eficaz. Los modelos multimodales actuales, en cambio, suelen compartimentalizar la información, lo que limita su flexibilidad y su verdadera comprensión.


¿Por qué la escala y la simple combinación de modalidades no nos llevarán a la AGI?

En los últimos años se ha impulsado un enfoque llamado maximalismo por escala: cuanta más información y capacidad de cómputo se le da a un modelo, mejores resultados puede obtener. Sin embargo, aunque esto ha funcionado para que los sistemas actuales imiten algunos aspectos de la inteligencia humana, no significa que hayan superado las barreras fundamentales de la comprensión y el razonamiento genuinos.

Intentar construir una AGI simplemente sumando modelos especializados para cada tipo de tarea (texto, visión, acción, etc.), pegándolos y esperando que surja una inteligencia general, es una estrategia limitada. Esta aproximación no permite que el sistema construya conceptos verdaderamente nuevos por sí mismo, como lo hacen los seres humanos.

Además, la manera en que se dividen actualmente las modalidades (texto, imagen, movilidad, etc.) no necesariamente corresponde a la forma en que las personas realmente piensan, perciben y actúan. Los humanos procesan la información de forma integrada y flexible, no por compartimentos. Hacer suposiciones rígidas sobre cómo debería segmentarse la inteligencia puede llevar a modelos que no sean capaces de generalizar cuando enfrentan nuevas situaciones.

Un ejemplo: al unir un sistema de procesamiento de texto y uno de imágenes, muchas veces la relación entre ambos es forzada. Por ejemplo, una imagen puede tener muchos niveles de interpretación; no siempre hay una correspondencia uno a uno entre las palabras que la describen y los objetos presentes en la imagen. Lo mismo ocurre en el sentido inverso: una frase puede traducirse de múltiples maneras en acciones o componentes visuales. Los modelos que sacrifican la riqueza de estas conexiones por una simple “fusión” de modalidades pierden la esencia de la inteligencia general.

Finalmente, es peligroso pensar que los sistemas actuales ya están cerca de la AGI porque logran imitar respuestas convincentes o aprobar pruebas pensadas para humanos. La verdadera inteligencia general conlleva la capacidad de aprender conceptos nuevos, adaptarse a circunstancias imprevistas y actuar en el mundo físico de manera autónoma y efectiva. Los modelos actuales, por el contrario, se entrenan sobre los resultados finales de la cultura y el conocimiento humano, no sobre los procesos que llevaron a la invención y descubrimiento de esos conceptos.


Buscar una inteligencia artificial verdaderamente general: sentido, integración y aprendizaje genuino

La promesa de la inteligencia artificial no debería ser solo imitar la capacidad humana de hablar o procesar información, sino integrar percepción, acción y razonamiento de forma unificada y flexible. Un enfoque realmente prometedor consiste en crear sistemas que aprendan e interactúen de manera directa con su entorno, como lo hace una persona al experimentar el mundo y descubrir cómo funcionan las cosas.

En vez de construir modelos separados para ver, leer o moverse, y luego intentar pegarlos, deberíamos buscar formas de que los sistemas desarrollen naturalmente estas habilidades a partir de la interacción y la experiencia. De ese modo, la distinción entre “leer”, “ver” y “actuar” dejaría de ser artificial y surgiría como consecuencia del propio proceso de aprendizaje.

Por ejemplo, un sistema capaz de percibir imágenes, comprender texto y manipular objetos debería procesar toda esa información a través de una única arquitectura integral, aprendiendo a conectar cada modalidad según la demanda de la situación, como hacen los humanos. Es probable que esto reduzca la eficiencia en el corto plazo, pero traerá una capacidad cognitiva mucho más flexible y creativa.

El desafío principal ya no es matemático: ya existen herramientas poderosas para crear modelos que puedan aproximar cualquier función. El reto es conceptual: identificar qué funciones y capacidades necesitamos, y cómo organizarlas en un todo coherente que sienta y actúe verdaderamente en el mundo.


Fuente: https://thegradient.pub/agi-is-not-multimodal/

Innovaciones en IA: Video, Entrenamiento Descentralizado y Robótica Distribuida

Avances en modelos de video, entrenamiento descentralizado y robótica distribuida

Mejoras en los modelos de video con atención radial: Un grupo de investigadores de instituciones como MIT, NVIDIA, Princeton, UC Berkeley y Stanford, junto con la startup First Intelligence, ha presentado Radial Attention, un nuevo mecanismo que permite entrenar modelos de generación de video de manera mucho más eficiente. A diferencia de los modelos de imagen, los videos requieren procesar muchas más «unidades de información» debido a la dimensión temporal, lo que genera altos costos computacionales y dificultad para escalar.

La clave de Radial Attention está en que la atención entre partes del video disminuye a medida que aumenta la distancia espacial y temporal. De este modo, se asignan recursos sólo donde es más relevante, logrando acelerar el entrenamiento hasta 2.78 veces y la inferencia hasta 2.35 veces en modelos avanzados como Hunyuan Video. Además, se mantuvo la calidad del video incluso al trabajar con videos hasta cuatro veces más largos. Estas innovaciones hacen más accesible y barata la generación de contenido audiovisual sintético, lo que podría transformar la forma en que producimos y consumimos videos en Internet.

Entrenamiento descentralizado de modelos de gran escala

Investigadores en China han desarrollado una nueva técnica llamada DiLoCoX que permite entrenar modelos de inteligencia artificial con más de 100.000 millones de parámetros usando múltiples computadoras conectadas por redes lentas. Tradicionalmente, los modelos más avanzados sólo podían entrenarse en centros de datos muy potentes y centralizados. Con DiLoCoX, es posible utilizar varios equipos distribuidos para entrenar inteligencias artificiales de gran tamaño, logrando resultados comparables a los métodos centralizados.

El reto principal era reducir el tiempo y la cantidad de información que se debía compartir entre equipos para evitar demoras por conexiones lentas. DiLoCoX introduce paralelismo en la estructura del modelo y compresión eficiente de la información para que los distintos nodos puedan trabajar de manera coordinada, minimizando la pérdida de calidad en el modelo final. Los experimentos demuestran que es posible ocultar gran parte del tiempo de comunicación y que el entrenamiento es hasta 357 veces más rápido que métodos previos bajo las mismas condiciones. Aunque aún no se han publicado evaluaciones detalladas del rendimiento final, este avance acerca la posibilidad de que grupos más diversos puedan desarrollar modelos de inteligencia artificial de primer nivel, no solo grandes empresas tecnológicas.

Evaluación y experimentación colaborativa en robótica

Un equipo internacional ha creado RoboArena, una plataforma para evaluar y comparar modelos de control robótico de manera descentralizada y colaborativa. El desarrollo de robots que puedan adaptarse a muchas tareas requiere experimentación repetida en hardware real, algo muy costoso y complejo a gran escala. RoboArena permite que diferentes investigadores suban sus modelos a un servidor común y estos sean probados en robots repartidos en todo el mundo. Los controles se enfrentan unos a otros en pruebas del tipo A/B y se generan rankings objetivos de desempeño a partir de la colaboración global.

Un elemento innovador es un sistema de «créditos» que motiva a quienes ofrecen sus robots para pruebas, permitiéndoles luego solicitar pruebas comparativas para sus propios desarrollos. Los resultados muestran que la precisión y utilidad de las evaluaciones mejora a medida que más laboratorios participan, consolidando la plataforma como alternativa eficiente a las evaluaciones convencionales. Esto representa un paso importante hacia la democratización de la robótica y acelera el progreso en el desarrollo de robots más versátiles y seguros en el mundo real.


Fuente: https://jack-clark.net/2025/06/30/import-ai-418-100b-distributed-training-run-decentralized-robots-ai-myths/