Skip to content

Avances en IA: Modelos, Hardware y Datos en Competencia

Competencia en IA: Modelos de Lenguaje, Hardware y Datos Masivos

Modelos rusos de IA y su posición global: Recientemente, la empresa rusa SaluteDevices presentó GigaChat, una familia de modelos diseñados especialmente para el idioma ruso. Aunque estos modelos introducen técnicas modernas, sus resultados abiertos son notablemente inferiores frente a competidores como Qwen 2.5 o LLaMa 3.1. La versión cerrada parece mostrar mejoras sorprendentes, pero surgen dudas sobre la validez de estos incrementos tan abruptos. En pruebas específicas para idioma ruso, GigaChat 2 Max ocupa apenas el sexto lugar, quedando por detrás de gigantes estadounidenses y chinos, como Claude, DeepSeek y Gemini. Esto refuerza la idea de que la frontera de la inteligencia artificial es principalmente una competencia entre Estados Unidos y China, siendo Rusia aún incapaz de competir de igual a igual, incluso en modelos más pequeños y abiertos.

Supercomputadoras e independencia tecnológica en China: Huawei ha dado un salto importante al presentar CloudMatrix, una súper computadora que incorpora cientos de procesadores propios y está totalmente optimizada para ejecutar modelos avanzados como DeepSeek-R1. La compañía destaca que su nuevo sistema y software propio logran eficiencias inéditas, superando incluso a los sistemas de referencia de NVIDIA en China. Lo más relevante es que este conjunto de hardware, software y modelo es de diseño chino, aunque por ahora los chips se fabriquen en el extranjero. Se trata de un ejemplo claro de cómo China avanza hacia la independencia y el desacoplamiento tecnológico en IA.

El valor de los datos masivos y organizados: Essential AI, fundada por pioneros del desarrollo de modelos de IA, ha lanzado el Essential-Web v1.0, un conjunto de datos compuesto por 24 billones de “tokens” recogidos de la web, acompañado de metadatos detallados como temática, complejidad y calidad de documento. Esta información permite filtrar y personalizar configuraciones para entrenar modelos en áreas como química, medicina, matemáticas y programación. Los resultados demuestran que utilizar estos filtros produce conjuntos de datos altamente competitivos o superiores en diversas disciplinas, contribuyendo a democratizar el desarrollo de modelos de lenguaje avanzados.


Fuente: https://jack-clark.net/2025/06/23/import-ai-417-russian-llms-huaweis-dgx-rival-and-24-tokens-for-training-ais/

Related Post

La revolución de Carbon Robotics en el campo

Innovación en la Identificación de Malezas La agricultura moderna se enfrenta al constante desafío de controlar malezas que compiten con los cultivos por nutrientes, agua y espacio. Tradicionalmente, reconocer y

El Futuro del Trabajo y la IA: Desafíos y Oportunidades

Automatización de las pruebas matemáticas y colaboración entre humanos e inteligencia artificial En la actualidad, la inteligencia artificial (IA) está revolucionando la manera en que abordamos la resolución de problemas

HPC-Ops: Eficiencia en modelos de lenguaje masivos

¿Qué es HPC-Ops y por qué es relevante? HPC-Ops es una biblioteca de operadores especialmente diseñada para hacer más eficientes y veloces los modelos de lenguaje de gran tamaño. Creado

Aún no hay comentarios, ¡añada su voz abajo!


Añadir un comentario

Powering over 1.5 million websites worldwide

Our set he for firmament morning sixth subdue darkness creeping gathered divide our let god moving.

Or

+10 378 267 3782

Contanos tu necesidad

Completá el formulario y nos pondremos en contacto a la brevededad para ayudarte a dar el siguiente paso.