Skip to content

Avances en IA: Modelos, Hardware y Datos en Competencia

Competencia en IA: Modelos de Lenguaje, Hardware y Datos Masivos

Modelos rusos de IA y su posición global: Recientemente, la empresa rusa SaluteDevices presentó GigaChat, una familia de modelos diseñados especialmente para el idioma ruso. Aunque estos modelos introducen técnicas modernas, sus resultados abiertos son notablemente inferiores frente a competidores como Qwen 2.5 o LLaMa 3.1. La versión cerrada parece mostrar mejoras sorprendentes, pero surgen dudas sobre la validez de estos incrementos tan abruptos. En pruebas específicas para idioma ruso, GigaChat 2 Max ocupa apenas el sexto lugar, quedando por detrás de gigantes estadounidenses y chinos, como Claude, DeepSeek y Gemini. Esto refuerza la idea de que la frontera de la inteligencia artificial es principalmente una competencia entre Estados Unidos y China, siendo Rusia aún incapaz de competir de igual a igual, incluso en modelos más pequeños y abiertos.

Supercomputadoras e independencia tecnológica en China: Huawei ha dado un salto importante al presentar CloudMatrix, una súper computadora que incorpora cientos de procesadores propios y está totalmente optimizada para ejecutar modelos avanzados como DeepSeek-R1. La compañía destaca que su nuevo sistema y software propio logran eficiencias inéditas, superando incluso a los sistemas de referencia de NVIDIA en China. Lo más relevante es que este conjunto de hardware, software y modelo es de diseño chino, aunque por ahora los chips se fabriquen en el extranjero. Se trata de un ejemplo claro de cómo China avanza hacia la independencia y el desacoplamiento tecnológico en IA.

El valor de los datos masivos y organizados: Essential AI, fundada por pioneros del desarrollo de modelos de IA, ha lanzado el Essential-Web v1.0, un conjunto de datos compuesto por 24 billones de “tokens” recogidos de la web, acompañado de metadatos detallados como temática, complejidad y calidad de documento. Esta información permite filtrar y personalizar configuraciones para entrenar modelos en áreas como química, medicina, matemáticas y programación. Los resultados demuestran que utilizar estos filtros produce conjuntos de datos altamente competitivos o superiores en diversas disciplinas, contribuyendo a democratizar el desarrollo de modelos de lenguaje avanzados.


Fuente: https://jack-clark.net/2025/06/23/import-ai-417-russian-llms-huaweis-dgx-rival-and-24-tokens-for-training-ais/

Related Post

Por qué la IA General No es Solo Multimodal

¿Por qué la Inteligencia Artificial General necesita comprender el mundo físico? Hoy, los avances en inteligencia artificial han llevado a muchos a pensar que estamos cerca de lograr una inteligencia

Riesgos globales de la carrera por la IA

¿Podría la carrera por una inteligencia artificial avanzada aumentar los conflictos? Las decisiones de los líderes sobre la inteligencia artificial avanzada pueden cambiar el mundo. Si quienes están al mando

¿Por Qué la AGI Requiere Experiencia Real?

¿Por qué la Inteligencia Artificial General requiere más que solo conectar modalidades? Los últimos avances en inteligencia artificial han llevado a muchos a pensar que una inteligencia artificial general (AGI)

Aún no hay comentarios, ¡añada su voz abajo!


Añadir un comentario

Powering over 1.5 million websites worldwide

Our set he for firmament morning sixth subdue darkness creeping gathered divide our let god moving.

Or

+10 378 267 3782

Contanos tu necesidad

Completá el formulario y nos pondremos en contacto a la brevededad para ayudarte a dar el siguiente paso.