A unicórnio canadense Cohere revelou recentemente o “Command A”, a última versão de seu modelo principal. Especialmente projetado, como seus predecessores, para atender às necessidades das empresas, este LLM de 111 bilhões de parâmetros, que combina desempenho e eficiência energética, compete com modelos líderes como GPT-4o e DeepSeek-V3.
 
Um dos principais trunfos do Command A para as empresas é sua pegada material mínima. Enquanto a maioria dos modelos comparáveis requer até 32 GPUs, o Command A funciona eficientemente com apenas duas GPUs A100 ou H100, resultando em uma redução significativa de custos e latência, além de uma maior velocidade de execução. Além de uma geração mais rápida do primeiro token, ele pode gerar até 156 tokens/s, o que é 1,75 vezes mais rápido que o GPT-4o e 2,4 vezes mais rápido que o DeepSeek-V3.
Desempenho do Command A
A Cohere avaliou o desempenho do Command A em comparação com o GPT-4o e o DeepSeek-V3, em benchmarks acadêmicos: MMLU (conhecimentos gerais), MATH, IFEval (acompanhamento de instruções), testes de agentes inteligentes (BFCL, Taubench) e benchmarks de codificação (MBPPPlus, SQL, RepoQA).
Suas capacidades em seguimento de instruções, codificação, especialmente em SQL, e em tarefas agenticas superam as de seus concorrentes.
Em testes de avaliação humana, o Command A, que cobre 23 das principais línguas, superou seus concorrentes em várias línguas, notavelmente em árabe dialetal, onde se mostrou mais coerente e preciso que o GPT-4o e o DeepSeek-V3. Essa capacidade de adaptação aos contextos locais representa uma vantagem estratégica para as empresas que operam internacionalmente.
Capacidades otimizadas para empresas
Ao contrário de seu predecessor, que suportava um comprimento de contexto de 128.000 tokens, o Command A possui um comprimento de contexto de 256 tokens, tornando-o apto para analisar longos documentos empresariais. Ele integra funcionalidades avançadas, como geração aumentada por recuperação (RAG) com citações verificáveis e o uso de ferramentas agenticas seguras.
É particularmente eficaz para:
  • Análise e extração de informações de relatórios financeiros volumosos;
  • Gestão de políticas de RH de acordo com especificidades locais;
  • Verificação e interpretação de regulamentações jurídicas complexas.
Graças a uma integração fluida com o North, a plataforma de agentes de IA da Cohere, o Command A permite que as empresas desenvolvam soluções de IA sob medida mantendo um alto nível de segurança e conformidade.
Disponibilidade e preços
Já disponível na plataforma Cohere, com suporte futuro pelos principais fornecedores de nuvem, o Command A é oferecido a um custo de $2,50 por 1 milhão de tokens de entrada e $10,00 por 1 milhão de tokens de saída. Também está acessível para fins de pesquisa no Hugging Face.

Para entender melhor

O que é um LLM e por que é importante para as empresas?

Um LLM (Large Language Model) é um modelo de inteligência artificial que usa grandes quantidades de dados para entender, gerar e manipular a linguagem natural. Para as empresas, isso pode transformar operações ao otimizar o atendimento ao cliente, analisar dados complexos e melhorar a comunicação e a tomada de decisões.

Como a Geração Aumentada por Recuperação (RAG) melhora as capacidades de um LLM como o Command A?

A RAG, ou Geração Aumentada por Recuperação, permite que um LLM enriqueça suas respostas com dados atuais e relevantes externos ao modelo. Isso é feito consultando bancos de dados ou documentos externos, verificando as informações fornecidas e aumentando a precisão e relevância das saídas geradas.