OpenAI introduceert Codex: naar een door agents ondersteunde software-engineering

OpenAI introduceert Codex: naar een door agents ondersteunde software-engineering

In kort : OpenAI heeft Codex onthuld, een nieuwe AI-agent voor het automatiseren van programmeertaken zoals codegeneratie en bugfixing. In tegenstelling tot klassieke systemen werkt Codex autonoom in een cloudomgeving, is in staat om complexe operaties uit te voeren en produceert leesbare code die voldoet aan de beste praktijken.

Na Operator (webnavigatie) en Deep Research (informatie synthese), kondigde OpenAI vrijdag een nieuw agent aan gewijd aan software-engineering: Codex (niet te verwarren met de eerste versie van Codex gelanceerd in 2021). Deze agent, geïntegreerd in de interface van ChatGPT, is ontworpen om bepaalde programmeertaken te automatiseren zoals het genereren van code, het detecteren en corrigeren van bugs, het schrijven van tests of het creëren van pull requests.

In tegenstelling tot klassieke code-assistentiesystemen, die zich beperken tot het voorstellen van aanvullingen of suggesties, werkt deze agent autonomer. De taken worden uitgevoerd in een geïsoleerde cloud-gebaseerde omgeving, geconfigureerd met de technische context verstrekt door de gebruiker (met name de inhoud van zijn code repository). Dit stelt de agent in staat om complexe operaties sequentieel of parallel uit te voeren, terwijl een zeker niveau van interne verificatie wordt gewaarborgd: hij kan bijvoorbeeld code uitvoeren, de resultaten analyseren, zijn eigen wijzigingen aanpassen en uitvoerdocumenten genereren zoals pull requests die klaar zijn om te worden beoordeeld.

Deze werking is gebaseerd op een model genaamd codex-1, een variant van het GPT-4 redeneermodel (intern door OpenAI aangeduid als "o3"). Dit model is specifiek verfijnd via versterkend leren op scenario's van softwareontwikkeling, met als doel leesbare code te produceren, consistent met de stijl van het project en in overeenstemming met goede praktijken.

Werking en beschikbaarheid

Codex is toegankelijk via de zijbalk van ChatGPT (voor gebruikers van de Pro, Team en Enterprise abonnementen). Twee hoofdopties worden aangeboden:

  • “Code” om de uitvoering van een taak aan te vragen (implementatie, correctie, etc.)

  • “Ask” om de agent te raadplegen over een bestaand bestand of structuur (functie, klasse, afhankelijkheid, etc.)

De tijd die nodig is voor de uitvoering hangt af van de complexiteit van de taak en varieert, volgens OpenAI, van enkele minuten tot een half uur. Verschillende bedrijven, waaronder Cisco, Superhuman, Temporal en Kodiak, experimenteren met de tool in reële gebruiksscenario's zoals het onderhoud van legacy code, het genereren van geautomatiseerde tests of het documenteren van projecten.

De service is voorlopig beperkt tot betalende abonnees, en de uitbreiding naar gebruikers van het "Plus"-aanbod is aangekondigd voor een latere datum.

Beter begrijpen

Wat is de potentiële regelgevende impact van het gebruik van een geïsoleerde cloud-gebaseerde omgeving voor software-engineering in termen van regelgeving en compliance?

Het gebruik van een geïsoleerde cloud-gebaseerde omgeving roept regelgevingsvragen op, met name met betrekking tot gegevensbeveiliging en naleving van gegevensbeschermingsnormen zoals de AVG. Bedrijven moeten ervoor zorgen dat hun cloudhostingpraktijken aan deze regels voldoen om juridische risico's te vermijden.

Hoe verbetert het fijn afstemmen van het codex-1-model met versterkend leren de prestaties in softwareontwikkeling?

Het fijn afstemmen van het codex-1-model met versterkend leren stelt het model in staat om van zijn fouten te leren en zich dynamisch aan te passen. Dit verbetert zijn vermogen om consistent code te genereren in lijn met moderne ontwikkelpraktijken, terwijl het nauwkeuriger wordt in het begrijpen en uitvoeren van programmeertaken.