Com o lançamento do R1, DeepSeek não apenas criou uma onda de choque no Vale do Silício, mas intensificou a concorrência dentro do próprio Império do Meio. Em fevereiro passado, Baidu, um dos principais atores chineses da GenAI, detentor do motor de busca homônimo, respondeu com o anúncio da abertura do código de seu modelo de IA Ernie em junho próximo, bem como a gratuidade de seu chatbot Ernie Bot. Ele acelerou ainda mais, pois ontem publicou o ERNIE 4.5, a última versão de seu modelo de fundação multimodal, mas também o ERNIE X1, um modelo focado em raciocínio, oferecendo desempenho comparável ao R1, mas pela metade do preço. Ambos estão integrados ao Ernie Bot, que, de fato, é gratuito um pouco mais cedo do que o previsto. Segundo
Baidu, o ERNIE 4.5 integra avanços significativos em compreensão, geração, raciocínio e memória. Ele se beneficia especialmente de uma melhor gestão de alucinações e uma otimização do raciocínio lógico. Sua capacidade de processar simultaneamente texto, imagens, som e vídeo o torna uma ferramenta poderosa para aplicações variadas, desde diálogos até a criação de conteúdo.
As melhorias trazidas ao modelo são atribuídas a várias tecnologias-chave, incluindo a máscara dinâmica de atenção "FlashMask", a mistura multimodal heterogênea de especialistas, a compressão de representação espaço-temporal, a construção de dados de treinamento centrada no conhecimento e o auto-feedback melhorado pós-treinamento.
Em seu comunicado, a empresa afirma que o ERNIE 4.5 supera o GPT-4.5 em vários benchmarks, sendo 100 vezes menos custoso.
Por sua vez, o ERNIE X1, focado em raciocínio multimodal e uso de ferramentas avançadas, se destacaria em planejamento, análise e resolução de problemas complexos. Ele integra funcionalidades específicas como pesquisa avançada, geração e interpretação de imagens, leitura de páginas web, bem como mapeamento conceitual via TreeMind.
Uma aposta na acessibilidade e competitividade
Ao tornar esses modelos gratuitos para o público em geral e oferecer tarifas competitivas para empresas através de sua plataforma de nuvem Qianfan, a
Baidu busca fortalecer sua influência no ecossistema de IA. O ERNIE 4.5 é oferecido a 0,004 RMB (cerca de 0,0005 euro) por mil tokens de entrada e 0,016 RMB (cerca de 0,002 euro) na saída, enquanto o ERNIE X1 apresenta preços ainda mais baixos: é oferecido a 0,002 RMB (cerca de 0,00025 euro) pelo mesmo número de tokens de entrada e 0,008 RMB (cerca de 0,001 euro) na saída.
Essa postura de preços agressiva é acompanhada por um desejo de democratizar a IA generativa, integrando progressivamente esses modelos nos produtos e serviços da
Baidu, incluindo seu motor de busca e o aplicativo Wenxiaoyan.
Ao oferecer um modelo com desempenho comparável ao R1, mas pela metade do preço, a
Baidu mostra claramente sua ambição de dominar o setor não apenas na China, mas também frente aos atores americanos.
Para entender melhor
O que é a máscara de atenção dinâmica « FlashMask » e como funciona?
A máscara de atenção dinâmica, conhecida como « FlashMask », é uma técnica avançada utilizada em modelos de IA para otimizar a alocação de atenção ao processar dados multimodais. Permite que o modelo foque e ajuste dinamicamente sua atenção nas partes mais relevantes dos dados de entrada, melhorando a eficiência do processamento e a precisão dos resultados.
Quais são as implicações regulatórias para a Baidu na China ao abrir seu modelo de IA Ernie como open source?
A abertura do modelo de IA Ernie da Baidu como open source pode ter implicações regulatórias significativas. Na China, o governo promove ativamente a inovação tecnológica enquanto garante a segurança nacional e a cibersegurança. A Baidu terá que navegar por esse ambiente regulatório complexo, garantindo a conformidade com as leis de proteção de dados e as regulações sobre exportação de tecnologia, enquanto busca fomentar a colaboração internacional e a inovação aberta.