OpenAI представляє Codex: до інженерії програмного забезпечення за допомогою агентів

OpenAI представляє Codex: до інженерії програмного забезпечення за допомогою агентів

У короткому : OpenAI представила Codex, новий агент штучного інтелекту для автоматизації завдань програмування, таких як генерація коду та виправлення помилок. На відміну від класичних систем, Codex працює автономно в хмарному середовищі, здатний виконувати складні операції та створювати читабельний код з дотриманням найкращих практик.

Після Operator (веб-навігація) і Deep Research (синтез інформації), OpenAI оголосила у п'ятницю про попередній перегляд нового агента, присвяченого інженерії програмного забезпечення: Codex (не плутати з першою версією Codex, запущеною в 2021 році). Цей агент, інтегрований в інтерфейс ChatGPT, призначений для автоматизації певних завдань програмування, таких як генерація коду, виявлення та виправлення помилок, написання тестів або створення pull requests.

На відміну від класичних систем допомоги в написанні коду, які лише пропонують завершення або підказки, цей агент функціонує більш автономно. Завдання виконуються в ізольованому середовищі на базі хмари, налаштованому з урахуванням технічного контексту, наданого користувачем (зокрема, вміст його репозиторію коду). Це дозволяє агенту виконувати складні операції послідовно або паралельно, забезпечуючи певний рівень внутрішньої перевірки: він може, наприклад, виконувати код, аналізувати результати, коригувати власні зміни та генерувати вихідні документи, такі як pull requests, готові до перегляду.

Це функціонування базується на моделі під назвою codex-1, варіації моделі міркувань GPT-4 (згадується як "o3" OpenAI у своїх внутрішніх комунікаціях). Ця модель була спеціально налаштована через навчання з підкріпленням на сценаріях розробки програмного забезпечення, з метою створення читабельного коду, який відповідає стилю проекту та дотримується найкращих практик.

Функціонування та доступність

Codex доступний з бокової панелі ChatGPT (для користувачів планів Pro, Team та Enterprise). Пропонуються два основних входи:

  • “Code” для запиту виконання завдання (реалізація, виправлення тощо)

  • “Ask” для запиту до агента про файл або існуючу структуру (функція, клас, залежність тощо)

Час, необхідний для виконання, залежить від складності завдання і варіюється, за словами OpenAI, від кількох хвилин до півгодини. Декілька компаній, включаючи Cisco, Superhuman, Temporal і Kodiak, експериментують з інструментом у реальних випадках використання, таких як обслуговування застарілого коду, генерація автоматизованих тестів або документація проектів.

Послуга наразі обмежена платними підписниками, і її розширення на користувачів пропозиції "Plus" оголошено на пізнішу дату.

Краще зрозуміти

Який потенційний регуляторний вплив використання ізольованого хмарного середовища для інженерії програмного забезпечення з точки зору регуляції та відповідності?

Використання ізольованого хмарного середовища викликає регуляторні проблеми, зокрема щодо безпеки даних і відповідності стандартам захисту даних, як-от GDPR. Компанії повинні забезпечити, щоб їхні практики хостингу в хмарі відповідали цим регуляціям, щоб уникнути юридичних ризиків.

Як тонке налаштування моделі codex-1 з використанням підкріплювального навчання підвищує її продуктивність у розробці програмного забезпечення?

Тонке налаштування моделі codex-1 з використанням підкріплювального навчання дозволяє моделі вчитися на своїх помилках і динамічно адаптуватися. Це підвищує її здатність генерувати код узгоджено і відповідно до сучасних практик розробки, покращуючи її точність в розумінні та виконанні програмних завдань.