Competencia en IA: Modelos de Lenguaje, Hardware y Datos Masivos
Modelos rusos de IA y su posición global: Recientemente, la empresa rusa SaluteDevices presentó GigaChat, una familia de modelos diseñados especialmente para el idioma ruso. Aunque estos modelos introducen técnicas modernas, sus resultados abiertos son notablemente inferiores frente a competidores como Qwen 2.5 o LLaMa 3.1. La versión cerrada parece mostrar mejoras sorprendentes, pero surgen dudas sobre la validez de estos incrementos tan abruptos. En pruebas específicas para idioma ruso, GigaChat 2 Max ocupa apenas el sexto lugar, quedando por detrás de gigantes estadounidenses y chinos, como Claude, DeepSeek y Gemini. Esto refuerza la idea de que la frontera de la inteligencia artificial es principalmente una competencia entre Estados Unidos y China, siendo Rusia aún incapaz de competir de igual a igual, incluso en modelos más pequeños y abiertos.
Supercomputadoras e independencia tecnológica en China: Huawei ha dado un salto importante al presentar CloudMatrix, una súper computadora que incorpora cientos de procesadores propios y está totalmente optimizada para ejecutar modelos avanzados como DeepSeek-R1. La compañía destaca que su nuevo sistema y software propio logran eficiencias inéditas, superando incluso a los sistemas de referencia de NVIDIA en China. Lo más relevante es que este conjunto de hardware, software y modelo es de diseño chino, aunque por ahora los chips se fabriquen en el extranjero. Se trata de un ejemplo claro de cómo China avanza hacia la independencia y el desacoplamiento tecnológico en IA.
El valor de los datos masivos y organizados: Essential AI, fundada por pioneros del desarrollo de modelos de IA, ha lanzado el Essential-Web v1.0, un conjunto de datos compuesto por 24 billones de “tokens” recogidos de la web, acompañado de metadatos detallados como temática, complejidad y calidad de documento. Esta información permite filtrar y personalizar configuraciones para entrenar modelos en áreas como química, medicina, matemáticas y programación. Los resultados demuestran que utilizar estos filtros produce conjuntos de datos altamente competitivos o superiores en diversas disciplinas, contribuyendo a democratizar el desarrollo de modelos de lenguaje avanzados.
Aún no hay comentarios, ¡añada su voz abajo!