OpenAI wprowadza Codex: w kierunku inżynierii oprogramowania wspomaganej przez agentów

OpenAI wprowadza Codex: w kierunku inżynierii oprogramowania wspomaganej przez agentów

W skrócie : OpenAI zaprezentowało Codex, nowego agenta sztucznej inteligencji do automatyzacji zadań programistycznych, takich jak generowanie kodu i korekta błędów. W przeciwieństwie do klasycznych systemów, Codex działa autonomicznie w środowisku chmurowym, potrafiąc wykonywać złożone operacje i produkować czytelny kod zgodny z dobrymi praktykami.

Po Operator (nawigacja w sieci) i Deep Research (synteza informacji), OpenAI ogłosiło w piątek zapowiedź nowego agenta dedykowanego inżynierii oprogramowania: Codex (nie mylić z pierwszą wersją Codex uruchomioną w 2021 roku). Ten agent, zintegrowany z interfejsem ChatGPT, jest zaprojektowany do automatyzacji niektórych zadań programistycznych, takich jak generowanie kodu, wykrywanie i korekta błędów, pisanie testów czy tworzenie żądań ściągnięcia.

W przeciwieństwie do klasycznych systemów wspomagania kodu, które ograniczają się do proponowania uzupełnień lub sugestii, ten agent działa bardziej autonomicznie. Zadania wykonywane są w izolowanym środowisku opartym na chmurze, skonfigurowanym z kontekstem technicznym dostarczonym przez użytkownika (w szczególności zawartością jego repozytorium kodu). To pozwala agentowi na przeprowadzanie złożonych operacji w sposób sekwencyjny lub równoległy, zapewniając jednocześnie pewien poziom wewnętrznej weryfikacji: może na przykład uruchamiać kod, analizować wyniki, dostosowywać własne modyfikacje i generować dokumenty wyjściowe, takie jak żądania ściągnięcia gotowe do przeglądu.

To działanie opiera się na modelu nazwanym codex-1, będącym wariantem modelu rozumowania GPT-4 (określanego jako "o3" przez OpenAI w komunikacji wewnętrznej). Model ten został specyficznie dopracowany poprzez uczenie ze wzmocnieniem na scenariuszach rozwoju oprogramowania, mając na celu produkcję kodu czytelnego, spójnego ze stylem projektu i zgodnego z dobrymi praktykami.

Działanie i dostępność

Codex jest dostępny z paska bocznego ChatGPT (dla użytkowników planów Pro, Team i Enterprise). Oferowane są dwa główne wejścia:

  • „Code” do zlecenia wykonania zadania (implementacja, korekta itp.)

  • „Ask” do zadawania pytań agentowi dotyczących istniejącego pliku lub struktury (funkcja, klasa, zależność itp.)

Czas potrzebny na wykonanie zależy od złożoności zadania i według OpenAI waha się od kilku minut do pół godziny. Kilka firm, w tym Cisco, Superhuman, Temporal i Kodiak, testuje narzędzie w rzeczywistych przypadkach użycia, takich jak utrzymanie kodu dziedziczonego, generowanie testów automatycznych czy dokumentacja projektów.

Usługa jest na razie ograniczona do płatnych subskrybentów, a jej rozszerzenie na użytkowników oferty „Plus” jest zapowiedziane na późniejszy termin.

Bardziej zrozumiałe

Jaki jest potencjalny wpływ regulacyjny użycia odizolowanego środowiska opartego na chmurze dla inżynierii oprogramowania w zakresie regulacji i zgodności?

Użycie izolowanego środowiska opartego na chmurze rodzi obawy regulacyjne, szczególnie w odniesieniu do bezpieczeństwa danych i zgodności z normami ochrony danych, jak RODO. Firmy muszą zapewnić, że ich praktyki hostingowe w chmurze są zgodne z tymi regulacjami, aby uniknąć ryzyka prawnego.

Jak dostrojenie modelu codex-1 za pomocą uczenia przez wzmacnianie poprawia jego wydajność w rozwoju oprogramowania?

Dostrojenie modelu codex-1 za pomocą uczenia przez wzmacnianie umożliwia modelowi uczenie się na błędach i dynamiczne dostosowywanie. To wzmacnia jego zdolność do generowania kodu zgodnie z nowoczesnymi praktykami rozwoju, zwiększając jego dokładność w rozumieniu i implementacji zadań programistycznych.