OpenAI prezintă Codex: spre o inginerie software asistată de agenți

OpenAI prezintă Codex: spre o inginerie software asistată de agenți

În scurt : OpenAI a dezvăluit Codex, un nou agent de inteligență artificială pentru automatizarea sarcinilor de programare precum generarea de cod și corectarea bug-urilor. Spre deosebire de sistemele clasice, Codex funcționează autonom într-un mediu cloud, capabil să execute operațiuni complexe și să producă cod lizibil și respectuos față de bunele practici.

După Operator (navigare web) și Deep Research (sinteză de informații), OpenAI a anunțat vineri un nou agent dedicat ingineriei software: Codex (de notat că nu trebuie confundat cu prima versiune a Codex lansată în 2021). Acest agent, integrat în interfața ChatGPT, este conceput pentru a automatiza anumite sarcini de programare, cum ar fi generarea de cod, detectarea și corectarea erorilor, scrierea de teste sau chiar crearea de pull requests.

Spre deosebire de sistemele clasice de asistență la cod, care se limitează la a propune completări sau sugestii, acest agent funcționează mai autonom. Sarcinile sunt executate într-un mediu izolat bazat pe cloud, configurat cu contextul tehnic furnizat de utilizator (inclusiv conținutul depozitului său de cod). Acest lucru permite agentului să efectueze operațiuni complexe fie secvențial, fie în paralel, asigurând în același timp un anumit nivel de verificare internă: poate, de exemplu, să execute cod, să analizeze rezultatele, să-și ajusteze propriile modificări și să genereze documente de ieșire, cum ar fi pull requests gata de revizuire.

Acest mod de funcționare se bazează pe un model numit codex-1, o variantă a modelului de raționament GPT-4 (referit sub numele „o3” de către OpenAI în comunicările sale interne). Acest model a fost specific ajustat prin învățare prin întărire pe scenarii de dezvoltare software, cu scopul de a produce cod lizibil, coerent cu stilul proiectului și respectuos față de bunele practici.

Funcționare și disponibilitate

Codex este accesibil din bara laterală a ChatGPT (pentru utilizatorii planurilor Pro, Team și Enterprise). Sunt oferite două intrări principale:

  • „Code” pentru a solicita realizarea unei sarcini (implementare, corectare etc.)

  • „Ask” pentru a interoga agentul despre un fișier sau o structură existentă (funcție, clasă, dependență etc.)

Timpul necesar pentru execuție depinde de complexitatea sarcinii și variază, conform OpenAI, de la câteva minute la o jumătate de oră. Mai multe companii, printre care Cisco, Superhuman, Temporal și Kodiak, experimentează cu acest instrument în cazuri de utilizare reale, cum ar fi mentenanța codului moștenit, generarea de teste automatizate sau documentarea proiectelor.

Serviciul este în prezent limitat la abonații plătitori, iar extinderea sa către utilizatorii ofertei „Plus” este anunțată pentru o dată ulterioară.

Pentru a înțelege mai bine

Care este impactul potențial reglementar al utilizării unui mediu izolat bazat pe cloud pentru ingineria software, din punct de vedere al reglementării și conformității?

Utilizarea unui mediu izolat bazat pe cloud ridică preocupări reglementare, în special în ceea ce privește securitatea datelor și conformitatea cu standardele de protecție a datelor, precum GDPR. Companiile trebuie să se asigure că practicile lor de găzduire în cloud respectă aceste reglementări pentru a evita riscurile legale.

Cum îmbunătățește reglarea fină a modelului codex-1 prin învățarea prin întăriri performanța acestuia în dezvoltarea software?

Reglarea fină a modelului codex-1 prin învățarea prin întăriri permite modelului să învețe din erorile sale și să se ajusteze dinamic. Acest lucru îmbunătățește capacitatea sa de a genera cod consecvent și conform practicilor moderne de dezvoltare, îmbunătățindu-i precizia în înțelegerea și implementarea sarcinilor de programare.