Anthropic dezvăluie Claude 4, agenții săi optimizați pentru programare și sarcini complexe

Anthropic dezvăluie Claude 4, agenții săi optimizați pentru programare și sarcini complexe

În scurt : Anthropic dezvăluie Claude Opus 4 și Claude Sonnet 4, modele AI pentru codare și raționament complex. Claude Opus 4, conceput pentru sarcini lungi, afișează performanțe impresionante pe benchmark-urile SWE și Terminal, în timp ce Claude Sonnet 4 oferă un răspuns rapid pentru aplicații zilnice.

Anthropic tocmai a dezvăluit noua generație a modelelor sale Claude prin lansarea Claude Opus 4 și Claude Sonnet 4. Aceste modele vizează explicit cazurile de utilizare avansată în codare, raționament complex și automatizare prin agenți, cu performanțe care redifinesc vârful de gamă al LLM-urilor actuale.


Două modele, două utilizări, o ambiție comună

Claude Opus 4 este prezentat de Anthropic ca cel mai bun model de codare din lume, cu rezultate remarcabile pe benchmark-urile SWE-bench (72,5%) și Terminal-bench (43,2%). Destinat sarcinilor lungi și complexe, este conceput să funcționeze timp de mai multe ore fără pierderi de performanță, ceea ce îl face ideal pentru arhitecturi multi-agenți sau fluxuri de lucru industriale grele.

Claude Sonnet 4, o versiune ușoară dar puternică, înlocuiește Sonnet 3.7 cu o îmbunătățire clară pe sarcinile de codare (72,7% pe SWE-bench). Este conceput pentru aplicații zilnice care necesită un răspuns rapid dar fiabil, inclusiv pentru utilizatorii gratuiți.


Benchmarks și performanțe: dominație pe sarcinile reale

 

Claude 4 depășește GPT-4 și Gemini 2.5 pe sarcini reale de inginerie software (SWE-bench Verified).

Claude 4 se distinge nu doar prin capacitățile sale de raționament, ci și prin capacitatea sa de a menține direcția fără scurtături logice. Potrivit Anthropic, cele două modele sunt cu 65% mai puțin susceptibile de a recurge la "shortcut-uri" și bucle infinite în sarcini agențiale critice decât predecesorul lor.

Funcționalități tehnice noi

Modelele Claude 4 inaugurează “extended thinking” cu instrumente integrate, permițând IA să treacă dinamic între raționament și utilizarea de instrumente (cum ar fi o căutare web) în timpul unei sarcini.

Ele pot:

  • Utiliza mai multe instrumente în paralel

  • Reține informații în fișiere locale, simulând o memorie de lucru

  • Genera rezumate de raționament pentru a îmbunătăți lizibilitatea lanțurilor lungi de gândire (chains of thoughts)

Claude Code: un "copilot" de dezvoltare autonomă

Deja în testare pe GitHub, Claude Code devine disponibil în versiune stabilă. Acest sistem oferă integrări native pentru VS Code și JetBrains, cu sugestii de cod afișate direct în fișierele dvs.

Un SDK este de asemenea pus la dispoziție pentru a dezvolta proprii agenți bazat pe Claude Code, cu un exemplu cheie: o integrare GitHub care permite lui Claude să acționeze automat pe PR, erori CI/CD sau refactoringuri complexe.

Disponibilitate și preț

Cele două modele sunt disponibile pe:

  • Anthropic API

  • Amazon Bedrock

  • Google Vertex AI

💰 Preț:

  • Claude Opus 4: $15 / $75 pe milion de tokens (input/output)

  • Claude Sonnet 4: $3 / $15

👉 Pentru a afla mai multe sau pentru a testa modelele: claude.ai

 

Între Gemini 2.5 Pro, OpenAI Codex și Claude 4, editorii de LLM par să dorească toți să accelereze pe ajutorul pentru programare, o sarcină cu valoare adăugată mare pentru LLM.

Pentru a înțelege mai bine

Ce este 'gândirea extinsă' cu instrumente integrate în modelele Claude 4?

'Gândirea extinsă' permite AI să treacă dinamic de la raționament la utilizarea instrumentelor externe, cum ar fi căutarea pe web, îmbunătățindu-și astfel eficacitatea în sarcini complexe.

Cum se integrează Anthropic în ecosistemul tehnologic prin platforme precum Amazon Bedrock și Google Vertex AI?

Anthropic se poziționează strategic prin integrarea în platforme majore precum Amazon Bedrock și Google Vertex AI, permițând acces extins la modelele sale prin diferite soluții cloud, facilitând astfel adoptarea de către utilizatori și industrii diverse.