OpenAI introduce Codex: hacia una ingeniería de software asistida por agentes

OpenAI introduce Codex: hacia una ingeniería de software asistida por agentes

TLDR : OpenAI ha revelado Codex, un nuevo agente de inteligencia artificial para automatizar tareas de programación como la generación de código y la corrección de errores. A diferencia de los sistemas clásicos, Codex funciona de manera autónoma en un entorno cloud, capaz de ejecutar operaciones complejas y producir código legible y respetuoso de las buenas prácticas.

Después de Operator (navegación web) y Deep Research (síntesis de información), OpenAI anunció el viernes la vista previa de un nuevo agente dedicado a la ingeniería de software: Codex (a no confundir con la primera versión de Codex lanzada en 2021). Este agente, integrado en la interfaz de ChatGPT, está diseñado para automatizar ciertas tareas de programación tales como la generación de código, la detección y corrección de errores, la escritura de pruebas o incluso la creación de pull requests.

A diferencia de los sistemas de asistencia al código clásicos, que se limitan a proponer completaciones o sugerencias, este agente funciona de manera más autónoma. Las tareas se ejecutan en un entorno aislado basado en la nube, configurado con el contexto técnico proporcionado por el usuario (particularmente el contenido de su repositorio de código). Esto permite al agente realizar operaciones complejas de manera secuencial o paralela, asegurando un cierto nivel de verificación interna: puede, por ejemplo, ejecutar código, analizar los resultados, ajustar sus propias modificaciones y generar documentos de salida como pull requests listas para ser revisadas.

Este funcionamiento se basa en un modelo llamado codex-1, una variante del modelo de razonamiento GPT-4 (referido como "o3" por OpenAI en sus comunicaciones internas). Este modelo ha sido específicamente afinado mediante aprendizaje por refuerzo en escenarios de desarrollo de software, con el objetivo de producir código legible, coherente con el estilo del proyecto y respetuoso de las buenas prácticas.

Funcionamiento y disponibilidad

Codex es accesible desde la barra lateral de ChatGPT (para los usuarios de las fórmulas Pro, Team y Enterprise). Se ofrecen dos entradas principales:

  • “Code” para solicitar la realización de una tarea (implementación, corrección, etc.)

  • “Ask” para interrogar al agente sobre un archivo o una estructura existente (función, clase, dependencia, etc.)

El tiempo necesario para la ejecución depende de la complejidad de la tarea y varía, según OpenAI, de unos minutos a media hora. Varias empresas, incluyendo Cisco, Superhuman, Temporal y Kodiak, están experimentando con la herramienta en casos de uso reales como el mantenimiento de código heredado, la generación de pruebas automatizadas o la documentación de proyectos.

El servicio está por ahora limitado a los suscriptores de pago, y su extensión a los usuarios de la oferta "Plus" está anunciada para una fecha posterior.

Para entender mejor

¿Cuál es el impacto regulatorio potencial del uso de un entorno basado en la nube aislado para la ingeniería de software, en términos de regulación y cumplimiento?

El uso de un entorno basado en la nube aislado plantea preocupaciones regulatorias, especialmente en lo que respecta a la seguridad de los datos y el cumplimiento de normas de protección de datos como el RGPD. Las empresas deben asegurarse de que sus prácticas de alojamiento en la nube cumplan con estas regulaciones para evitar riesgos legales.

¿Cómo mejora el ajuste fino del modelo codex-1 con el aprendizaje de refuerzo su rendimiento en el desarrollo de software?

El ajuste fino del modelo codex-1 con el aprendizaje de refuerzo permite al modelo aprender de sus errores y ajustarse dinámicamente. Esto mejora su capacidad para generar código de manera coherente y de acuerdo con las prácticas modernas de desarrollo, aumentando su precisión en la comprensión e implementación de tareas de programación.