Con el lanzamiento de R1, DeepSeek no solo creó una onda de choque en Silicon Valley, sino que intensificó la competencia dentro del propio Imperio del Medio. En febrero pasado, Baidu, un actor principal chino de la GenAI, propietario del motor de búsqueda epónimo, respondió con el anuncio de la publicación en código abierto en junio próximo de su modelo de IA Ernie, así como la gratuidad de su chatbot Ernie Bot. Ha redoblado esfuerzos, ya que ayer publicó ERNIE 4.5, la última versión de su modelo de fundación multimodal, pero también ERNIE X1, un modelo enfocado en el razonamiento, ofreciendo prestaciones comparables a R1, pero a mitad de precio. Ambos están integrados en Ernie Bot, que de hecho, es gratuito un poco antes de lo previsto. Según
Baidu, ERNIE 4.5 integra avances significativos en comprensión, generación, razonamiento y memoria. Se beneficia notablemente de una mejor gestión de las alucinaciones y una optimización del razonamiento lógico. Su capacidad para tratar simultáneamente texto, imágenes, sonido y video lo convierte en una herramienta poderosa para aplicaciones variadas, desde el diálogo hasta la creación de contenido.
Las mejoras aportadas al modelo se atribuyen a varias tecnologías clave, incluyendo el enmascaramiento dinámico de la atención «FlashMask», la mezcla multimodal heterogénea de expertos, la compresión de representación espaciotemporal, la construcción de datos de entrenamiento centrada en el conocimiento, la auto-retroalimentación mejorada post-formación.
En su comunicado, la empresa afirma que ERNIE 4.5 supera a GPT-4.5 en varios benchmarks, siendo además 100 veces menos costoso.
Por su parte, ERNIE X1, centrado en el razonamiento multimodal y el uso de herramientas avanzadas, destacaría en planificación, análisis y resolución de problemas complejos. Integra funcionalidades específicas como búsqueda avanzada, generación e interpretación de imágenes, lectura de páginas web así como el mapeo conceptual vía TreeMind.
Una apuesta por la accesibilidad y la competitividad
Al hacer estos modelos gratuitos para el público en general y ofrecer tarifas competitivas para las empresas a través de su plataforma cloud Qianfan,
Baidu busca reforzar su influencia en el ecosistema de la IA. ERNIE 4.5 se ofrece a 0,004 RMB (alrededor de 0,0005 euros) por mil tokens de entrada y 0,016 RMB (alrededor de 0,002 euros) en salida, mientras que ERNIE X1 muestra precios aún más bajos: se ofrece a 0,002 RMB (alrededor de 0,00025 euros) para el mismo número de tokens de entrada y 0,008 RMB (alrededor de 0,001 euros) en salida.
Este posicionamiento tarifario agresivo se acompaña de una voluntad de democratizar la IA generativa, al tiempo que integra progresivamente estos modelos en los productos y servicios de
Baidu, en particular su motor de búsqueda y la aplicación Wenxiaoyan.
Al ofrecer un modelo con prestaciones comparables a R1, pero a mitad de precio,
Baidu muestra claramente su ambición de dominar el sector no solo en China sino también frente a los actores estadounidenses.
Para entender mejor
¿Qué es el enmascaramiento dinámico de atención « FlashMask » y cómo funciona?
El enmascaramiento dinámico de atención, conocido como « FlashMask », es una técnica avanzada utilizada en modelos de IA para optimizar la asignación de atención al procesar datos multimodales. Permite que el modelo se enfoque y ajuste dinámicamente su atención en las partes más relevantes de los datos entrantes, mejorando así la eficiencia del procesamiento y la precisión de los resultados.
¿Cuáles son las implicaciones regulatorias para Baidu en China al abrir su modelo de IA Ernie como código abierto?
La apertura del modelo de IA Ernie de Baidu como código abierto podría tener importantes implicaciones regulatorias. En China, el gobierno promueve activamente la innovación tecnológica al tiempo que garantiza la seguridad nacional y la ciberseguridad. Baidu deberá navegar en este complejo entorno regulatorio, asegurando el cumplimiento de las leyes de protección de datos y las regulaciones sobre la exportación tecnológica, mientras busca fomentar la colaboración internacional y la innovación abierta.