Po Operator (nawigacja w sieci) i Deep Research (synteza informacji), OpenAI ogłosiło w piątek zapowiedź nowego agenta dedykowanego inżynierii oprogramowania: Codex (nie mylić z pierwszą wersją Codex uruchomioną w 2021 roku). Ten agent, zintegrowany z interfejsem ChatGPT, jest zaprojektowany do automatyzacji niektórych zadań programistycznych, takich jak generowanie kodu, wykrywanie i korekta błędów, pisanie testów czy tworzenie żądań ściągnięcia.
W przeciwieństwie do klasycznych systemów wspomagania kodu, które ograniczają się do proponowania uzupełnień lub sugestii, ten agent działa bardziej autonomicznie. Zadania wykonywane są w izolowanym środowisku opartym na chmurze, skonfigurowanym z kontekstem technicznym dostarczonym przez użytkownika (w szczególności zawartością jego repozytorium kodu). To pozwala agentowi na przeprowadzanie złożonych operacji w sposób sekwencyjny lub równoległy, zapewniając jednocześnie pewien poziom wewnętrznej weryfikacji: może na przykład uruchamiać kod, analizować wyniki, dostosowywać własne modyfikacje i generować dokumenty wyjściowe, takie jak żądania ściągnięcia gotowe do przeglądu.
To działanie opiera się na modelu nazwanym codex-1, będącym wariantem modelu rozumowania GPT-4 (określanego jako "o3" przez OpenAI w komunikacji wewnętrznej). Model ten został specyficznie dopracowany poprzez uczenie ze wzmocnieniem na scenariuszach rozwoju oprogramowania, mając na celu produkcję kodu czytelnego, spójnego ze stylem projektu i zgodnego z dobrymi praktykami.
Działanie i dostępność
Codex jest dostępny z paska bocznego ChatGPT (dla użytkowników planów Pro, Team i Enterprise). Oferowane są dwa główne wejścia:
„Code” do zlecenia wykonania zadania (implementacja, korekta itp.)
„Ask” do zadawania pytań agentowi dotyczących istniejącego pliku lub struktury (funkcja, klasa, zależność itp.)
Czas potrzebny na wykonanie zależy od złożoności zadania i według OpenAI waha się od kilku minut do pół godziny. Kilka firm, w tym Cisco, Superhuman, Temporal i Kodiak, testuje narzędzie w rzeczywistych przypadkach użycia, takich jak utrzymanie kodu dziedziczonego, generowanie testów automatycznych czy dokumentacja projektów.
Usługa jest na razie ograniczona do płatnych subskrybentów, a jej rozszerzenie na użytkowników oferty „Plus” jest zapowiedziane na późniejszy termin.
Bardziej zrozumiałe
Jaki jest potencjalny wpływ regulacyjny użycia odizolowanego środowiska opartego na chmurze dla inżynierii oprogramowania w zakresie regulacji i zgodności?
Użycie izolowanego środowiska opartego na chmurze rodzi obawy regulacyjne, szczególnie w odniesieniu do bezpieczeństwa danych i zgodności z normami ochrony danych, jak RODO. Firmy muszą zapewnić, że ich praktyki hostingowe w chmurze są zgodne z tymi regulacjami, aby uniknąć ryzyka prawnego.
Jak dostrojenie modelu codex-1 za pomocą uczenia przez wzmacnianie poprawia jego wydajność w rozwoju oprogramowania?
Dostrojenie modelu codex-1 za pomocą uczenia przez wzmacnianie umożliwia modelowi uczenie się na błędach i dynamiczne dostosowywanie. To wzmacnia jego zdolność do generowania kodu zgodnie z nowoczesnymi praktykami rozwoju, zwiększając jego dokładność w rozumieniu i implementacji zadań programistycznych.