Operator (웹 탐색) 및 Deep Research (정보 종합) 이후, OpenAI는 금요일에 소프트웨어 엔지니어링에 전념하는 새로운 에이전트의 미리보기를 발표했습니다: Codex (2021년에 출시된 첫 번째 버전의 Codex와 혼동하지 마세요). 이 에이전트는 ChatGPT의 인터페이스에 통합되어 코드 생성, 버그 탐지 및 수정, 테스트 작성, 풀 리퀘스트 생성과 같은 특정 프로그래밍 작업을 자동화하도록 설계되었습니다.
전통적인 코드 지원 시스템과 달리, 이 에이전트는 보다 자율적으로 작동합니다. 작업은 사용자가 제공한 기술적 컨텍스트(특히 코드 저장소의 내용)를 기반으로 구성된 클라우드 기반의 고립된 환경에서 실행됩니다. 이를 통해 에이전트는 복잡한 작업을 순차적 또는 병렬로 수행하면서 내부 검증 수준을 보장할 수 있습니다: 예를 들어, 코드를 실행하고 결과를 분석하며 자체 수정 사항을 조정하고 검토할 준비가 된 풀 리퀘스트와 같은 출력 문서를 생성할 수 있습니다.
이 작동 방식은 GPT-4의 추론 모델의 변형인 codex-1 모델에 기반합니다(OpenAI의 내부 커뮤니케이션에서 "o3"으로 참조됨). 이 모델은 강화 학습을 통한 세밀한 조정을 통해 소프트웨어 개발 시나리오에서 읽기 쉽고 프로젝트의 스타일과 일관되며 모범 사례를 준수하는 코드를 생성하기 위해 특별히 조정되었습니다.
작동 방식 및 이용 가능성
Codex는 ChatGPT의 사이드바에서 접근할 수 있습니다( Pro, Team, Enterprise 사용자 전용). 두 가지 주요 입력이 제공됩니다:
“Code”는 작업 수행(구현, 수정 등)을 요청하기 위한 것입니다.
“Ask”는 파일 또는 기존 구조(함수, 클래스, 종속성 등)에 대해 에이전트에게 문의하는 것입니다.
작업 수행에 필요한 시간은 작업의 복잡성에 따라 다르며, OpenAI에 따르면 몇 분에서 최대 반 시간까지 걸립니다. Cisco, Superhuman, Temporal, Kodiak을 포함한 여러 기업이 레거시 코드 유지보수, 자동화된 테스트 생성 및 프로젝트 문서화를 포함한 실제 사용 사례에서 도구를 실험하고 있습니다.
이 서비스는 현재 유료 가입자에게만 제한되어 있으며, "Plus" 제공 사용자로의 확장은 추후 날짜에 발표될 예정입니다.
더 잘 이해하기
소프트웨어 엔지니어링을 위한 고립된 클라우드 기반 환경을 사용하는 것의 규제 및 준수 측면에서의 잠재적인 규제 영향은 무엇입니까?
고립된 클라우드 기반 환경 사용은 특히 데이터 보안 및 GDPR과 같은 데이터 보호 기준 준수와 관련하여 규제상의 우려를 제기합니다. 기업은 클라우드 호스팅 실습이 이러한 규정을 준수하는지 확인해야 합니다.
강화 학습으로 codex-1 모델을 미세 조정하는 것이 소프트웨어 개발에서 성능을 어떻게 향상시킵니까?
강화 학습으로 codex-1 모델을 미세 조정하면 모델이 실수에서 배우고 동적으로 조정할 수 있습니다. 이로 인해 현대 개발 관행과 일치하면서 일관되게 코드를 생성하는 능력이 향상되고, 프로그래밍 작업을 이해하고 구현하는 정확성이 향상됩니다.