OpenAI introduz Codex: rumo a uma engenharia de software assistida por agentes

Em resumo : OpenAI revelou Codex, um novo agente de inteligência artificial para automatizar tarefas de programação como a geração de código e correção de bugs. Diferente dos sistemas clássicos, Codex opera autonomamente em um ambiente em nuvem, capaz de realizar operações complexas e produzir código legível e em conformidade com as boas práticas.

Após Operator (navegação web) e Deep Research (síntese de informação), a OpenAI anunciou na sexta-feira a prévia de um novo agente dedicado à engenharia de software: Codex (a não ser confundido com a primeira versão do Codex lançada em 2021). Este agente, integrado à interface do ChatGPT, é projetado para automatizar certas tarefas de programação como a geração de código, a detecção e correção de bugs, a escrita de testes ou ainda a criação de pull requests.

Ao contrário dos sistemas clássicos de assistência ao código, que se limitam a sugerir complementos ou sugestões, este agente opera de forma mais autônoma. As tarefas são executadas em um ambiente isolado baseado em nuvem, configurado com o contexto técnico fornecido pelo usuário (notadamente o conteúdo do seu repositório de código). Isso permite ao agente realizar operações complexas de maneira sequencial ou paralela, ao mesmo tempo que garante um certo nível de verificação interna: ele pode, por exemplo, executar código, analisar os resultados, ajustar suas próprias modificações e gerar documentos de saída como pull requests prontas para revisão.

Este funcionamento baseia-se em um modelo chamado codex-1, uma variação do modelo de raciocínio GPT-4 (referenciado como "o3" pela OpenAI em suas comunicações internas). Este modelo foi especificamente refinado via aprendizado por reforço em cenários de desenvolvimento de software, com o objetivo de produzir código legível, coerente com o estilo do projeto e respeitoso das boas práticas.

Funcionamento e disponibilidade

Codex está acessível a partir da barra lateral do ChatGPT (para os usuários dos planos Pro, Team e Enterprise). Duas entradas principais são oferecidas:

“Code” para solicitar a realização de uma tarefa (implementação, correção, etc.)
“Ask” para interrogar o agente sobre um arquivo ou uma estrutura existente (função, classe, dependência, etc.)

O tempo necessário para a execução depende da complexidade da tarefa e varia, segundo a OpenAI, de alguns minutos a meia hora. Várias empresas, incluindo Cisco, Superhuman, Temporal e Kodiak, estão experimentando a ferramenta em casos de uso reais, como a manutenção de código legado, a geração de testes automatizados ou a documentação de projetos.

O serviço está por enquanto limitado aos assinantes pagantes, e sua extensão aos usuários da oferta "Plus" está anunciada para uma data futura.

Traduzido de OpenAI introduit Codex : vers une ingénierie logicielle assistée par agents

Para entender melhor

Qual é o impacto regulatório potencial do uso de um ambiente isolado baseado em nuvem para engenharia de software, em termos de regulação e conformidade?

O uso de um ambiente isolado baseado em nuvem levanta preocupações regulatórias, especialmente em relação à segurança de dados e conformidade com padrões de proteção de dados como o RGPD. As empresas devem garantir que suas práticas de hospedagem em nuvem estejam alinhadas com essas regulamentações para evitar riscos legais.

Como o ajuste fino do modelo codex-1 com aprendizado por reforço melhora seu desempenho no desenvolvimento de software?

O ajuste fino do modelo codex-1 com aprendizado por reforço permite que o modelo aprenda com seus erros e se ajuste dinamicamente. Isso melhora sua capacidade de gerar código de forma consistente e alinhada com práticas modernas de desenvolvimento, aumentando sua precisão na compreensão e implementação de tarefas de programação.