OpenAI anuncia el lanzamiento de GPT-4.1: enfoque en codificación, seguimiento de instrucciones y gestión extendida de contexto

OpenAI acaba de lanzar tres nuevos modelos dentro de su API: GPT-4.1, GPT-4.1 mini y GPT-4.1 nano. Estos modelos aportan mejoras significativas en términos de codificación, seguimiento de instrucciones, y ofrecen una gestión extendida del contexto, alcanzando hasta 1 millón de tokens.

Rendimiento optimizado

El modelo insignia, GPT-4.1, mejora sensiblemente el rendimiento en comparación con GPT-4o, especialmente en los siguientes ámbitos:

Codificación: GPT-4.1 alcanza un 54,6 % en el benchmark SWE-bench Verified, un aumento notable en comparación con GPT-4o (33,2 %) y GPT-4.5 (38 %). Este resultado refleja una mejora en su capacidad para resolver problemas complejos de desarrollo de software.
Seguimiento de instrucciones: En la evaluación MultiChallenge de Scale, GPT-4.1 obtiene un 38,3 %, mejorando así en 10,5 puntos absolutos el rendimiento en comparación con GPT-4o.
Contexto largo: GPT-4.1 establece un nuevo récord con un 72 % en el benchmark Video-MME, dedicado a la comprensión de contenidos multimodales en contexto extendido.

Una gama completa para satisfacer diversas necesidades

Además de GPT-4.1, las versiones mini y nano ofrecen compromisos efectivos entre rendimiento y coste:

GPT-4.1 mini: este modelo más compacto supera a GPT-4o en varias evaluaciones al tiempo que reduce considerablemente la latencia (casi a la mitad) y el coste (reducción del 83 %).
GPT-4.1 nano: el modelo más rápido y económico, ideal para tareas como la clasificación o la autocompleción, ofreciendo a pesar de su tamaño reducido, un contexto que alcanza hasta 1 millón de tokens.

Capacidades reforzadas para agentes inteligentes

Gracias a sus mejoras en fiabilidad de seguimiento de instrucciones y en comprensión de contexto extendido, GPT-4.1 refuerza las aplicaciones basadas en agentes autónomos. Los desarrolladores pueden ahora construir sistemas más fiables y eficientes para la gestión documental, el desarrollo de software, o el procesamiento automatizado de solicitudes de clientes.

Fin programado de GPT-4.5 Preview

OpenAI ha anunciado la depreciación próxima del modelo GPT-4.5 Preview en favor de GPT-4.1, ofreciendo un rendimiento superior a menor coste. GPT-4.5 Preview se desactivará a partir del 14 de julio de 2025, para permitir a los desarrolladores realizar una transición fluida.

Disponibilidad exclusiva a través de API

Cabe destacar que GPT-4.1 estará disponible exclusivamente a través de la API de OpenAI. Los usuarios de ChatGPT se benefician gradualmente de las mejoras de GPT-4.1 integradas en la versión GPT-4o.

Tarificación optimizada

Con una tarificación revisada a la baja, GPT-4.1 está ahora disponible a un coste inferior en un 26 % en comparación con GPT-4o para las solicitudes comunes. La tarificación muy competitiva de GPT-4.1 nano lo convierte en la oferta más asequible jamás propuesta por OpenAI.

Fuente: https://openai.com/index/gpt-4-1/

Traducido de OpenAI annonce le lancement de GPT-4.1 : accent sur le codage, le suivi des instructions et la gestion étendue du contexte

Para entender mejor

¿Qué es el benchmark SWE-bench Verified utilizado para evaluar los modelos de OpenAI?

El SWE-bench Verified es un conjunto de pruebas diseñado para evaluar la capacidad de los modelos de inteligencia artificial para resolver problemas complejos de desarrollo de software. Mide las habilidades de codificación de los modelos y su eficiencia para seguir instrucciones precisas de desarrollo.

¿Cuál es la regulación actual respecto a los modelos de IA como GPT-4.1?

Los modelos de IA como GPT-4.1 deben cumplir con regulaciones que incluyen la protección de datos personales, la transparencia de los algoritmos y la responsabilidad en caso de sesgo. La Unión Europea está trabajando en la Ley de IA, que podría imponer normas estrictas de cumplimiento para los modelos comerciales.