Logo ActuIA ActuIA

La vostra fonte di riferimento per le informazioni sull’intelligenza artificiale

Français English Español Deutsch Nederlands Română Polski Português العربية Türkçe Українська 中文 日本語 한국어
Pubblica
Home
Osservatorio IA

Per categoria

Finanziamento Fusioni e acquisizioni Rilascio di modello Lancio di prodotto Partnership Programma pubblico / bando Regolamentazione e governance Contenzioso Ricerca e scienza Implementazione e adozione Infrastruttura e calcolo Aziendale e strategia Sicurezza e incidenti Rapporto e studio Evento

Per settore

Assicurazione Cultura Difesa Finanze Giustizia Impresa Industria Istruzione Marketing Media Prevenzione dei rischi Ricerca fondamentale Salute - medicina Social media Telecomunicazioni Trasporto

Per categoria

Finanziamento Fusioni e acquisizioni Rilascio di modello Lancio di prodotto Partnership Programma pubblico / bando Regolamentazione e governance Contenzioso Ricerca e scienza Implementazione e adozione Infrastruttura e calcolo Aziendale e strategia Sicurezza e incidenti Rapporto e studio Evento

Per settore

Assicurazione Cultura Difesa Finanze Giustizia Impresa Industria Istruzione Marketing Media Prevenzione dei rischi Ricerca fondamentale Salute - medicina Social media Telecomunicazioni Trasporto
Ultimi articoli
Lingua

LLM: grandi modelli linguistici e foundation models

Vai alle ultime notizie
Tech family
I grandi modelli linguistici (in inglese Large Language Models, o LLM) sono reti neurali addestrate su enormi corpus testuali per prevedere la continuazione piu probabile di una sequenza di parole. Dal 2022, rappresentano il motore principale dell'IA generativa e il campo di una competizione industriale senza precedenti tra OpenAI, Anthropic, Google DeepMind, Meta, Mistral AI, Alibaba, DeepSeek e una ventina di altri protagonisti. Questa pagina sintetizza la loro architettura, i principali attori, i modelli di riferimento nel 2026 e le controversie che li circondano.

📰 Actualités récentes

Notizie recenti

I grandi modelli di linguaggio (LLM) continuano a trasformare il panorama dell'intelligenza artificiale, affermandosi come strumenti essenziali in vari campi, dalla cybersicurezza alla medicina. Recentemente, DeepSeek ha svelato un aggiornamento del suo modello R1, il DeepSeek-R1-0528, che rafforza le sue capacità di ragionamento, logica e programmazione. Questa versione, pubblicata il 28 maggio 2025, si avvicina alle prestazioni dei modelli di punta di OpenAI e Google, riducendo al contempo il tasso di allucinazione, un problema ricorrente per gli LLM. Parallelamente, Tencent ha introdotto Hunyuan-T1, un modello di ragionamento che utilizza un'architettura ibrida innovativa per competere con i leader del mercato. Questi sviluppi sottolineano una tendenza crescente verso il miglioramento delle capacità di ragionamento degli LLM, un elemento chiave per la loro capacità di integrarsi in sistemi complessi e critici.

Nel campo della cybersicurezza, gli LLM dimostrano il loro potenziale facilitando il rilevamento e l'analisi delle minacce. Uno studio dell'Università di New York evidenzia la loro capacità di sfruttare grandi quantità di dati testuali per anticipare e reagire agli attacchi, trasformando così la cybersicurezza in un settore più reattivo e proattivo. I modelli come SecureBERT, specializzati nella cybersicurezza, mostrano risultati promettenti, sebbene il loro affinamento rimanga una sfida per le aziende. Questa evoluzione verso LLM specializzati riflette una tendenza alla diversificazione delle applicazioni dei modelli di linguaggio, rispondendo a esigenze specifiche migliorando al contempo la loro precisione e affidabilità.

L'entusiasmo per gli LLM open source continua anche, con iniziative come quelle dell'Allen Institute for AI, che ha lanciato Tülu 3 405B, un modello open source performante basato su Llama 3.1. Questo modello si distingue per l'utilizzo dell'apprendimento per rinforzo con ricompense verificabili, migliorando le sue prestazioni in compiti complessi. In parallelo, Mistral AI ha lanciato Mistral Small 3, un modello ottimizzato per la latenza, offrendo un'alternativa open source ai modelli proprietari. Queste iniziative riflettono una volontà di democratizzare l'accesso agli LLM riducendo al contempo i costi di inferenza, una questione cruciale per ampliare la loro adozione, soprattutto in ambienti dove le risorse sono limitate.

Man mano che i grandi modelli di linguaggio continuano a svilupparsi, permangono delle sfide, in particolare in termini di costo di inferenza e impatto ambientale. Microsoft ha recentemente presentato BitNet.cpp, un framework open source che ottimizza l'inferenza degli LLM quantificati a 1 bit, riducendo così la loro impronta di carbonio. Questa innovazione sottolinea l'importanza della sostenibilità nell'evoluzione degli LLM, mentre la dimensione e la complessità dei modelli continuano ad aumentare. Inoltre, l'integrazione degli LLM in campi come la diagnostica medica deve ancora essere perfezionata, lo studio condotto da UVA Health indica che sebbene gli LLM possano superare i medici in alcuni compiti, la loro integrazione non ha ancora migliorato significativamente le prestazioni diagnostiche complessive.

Guida completa

Architettura: dal transformer ai modelli moderni

L'architettura transformer, da cui derivano tutti i LLM moderni, si basa su due elementi fondamentali. Il primo è il meccanismo di auto-attention, che consente al modello di calcolare, per ogni posizione del testo, una combinazione pesata delle rappresentazioni delle altre posizioni. Questa operazione è intrinsecamente parallelizzabile, motivo per cui i transformer hanno soppiantato le architetture ricorrenti (RNN, LSTM) che dominavano il NLP fino al 2017. Il secondo elemento è l'empilamento di decine di layer identici di transformer (tipicamente tra 32 e 96 nei modelli di punta), ciascuno dei quali affina la rappresentazione.

I LLM contemporanei si articolano in diverse varianti architetturali:

  • modelli dense, in cui tutti i parametri sono attivati a ogni inferenza (GPT-4 storico, Claude, Llama 3.1 405B);
  • modelli Mixture of Experts (MoE), in cui solo alcuni sottoreti esperti vengono attivati in base al token elaborato, riducendo così il costo di inferenza a parità di parametri (Mixtral, DeepSeek-V3, GPT-4o presunto);
  • modelli multimodali nativi, che ingeriscono e producono testo, immagini, audio e video in uno spazio di rappresentazione unificato (Gemini, GPT-4o, Pixtral Large, Claude 3.5 Sonnet);
  • modelli di ragionamento (reasoning models), che producono una catena di pensiero esplicita prima di rispondere - DeepSeek-R1, OpenAI o1/o3, Tencent Hunyuan-T1, Gemini Thinking - a fronte di una latenza maggiore ma con una qualità superiore su compiti di matematica, logica e programmazione.

I principali attori nel 2026

OpenAI resta il leader percepito del mercato con ChatGPT, GPT-4o, GPT-4o mini e la famiglia di modelli di ragionamento o1/o3. L'azienda, valutata diverse centinaia di miliardi di dollari nel 2026, è finanziata principalmente da Microsoft e SoftBank. La sua strategia commerciale combina API (pagamento a token), prodotto consumer (ChatGPT Plus a 20 $/mese) e offerta enterprise (ChatGPT Enterprise, Azure OpenAI Service). OpenAI ha ampliato il proprio raggio d'azione con OAI-SearchBot, il suo crawler di ricerca, e SearchGPT.

Anthropic, fondata nel 2021 da ex membri di OpenAI tra cui Dario e Daniela Amodei, ha fatto della sicurezza il proprio elemento distintivo. La famiglia Claude (Haiku, Sonnet, Opus) è particolarmente apprezzata per la scrittura, il coding e il ragionamento su contesti estesi. Anthropic è finanziata da Amazon, Google e SoftBank. Nel maggio 2026, Anthropic ha confermato la locazione di una parte della capacità di Colossus 1 di xAI per circa 1,25 miliardi di dollari al mese, a testimonianza della concentrazione delle risorse di calcolo.

Google DeepMind dal 2023 consolida le proprie attività IA sotto il marchio Gemini. La famiglia Gemini (Nano, Flash, Pro, Ultra, poi Gemini 2.0 Flash nel dicembre 2024) è integrata nel motore di ricerca (AI Overviews) e nella suite Workspace. Google beneficia di un vantaggio strutturale grazie al controllo sui dati di training (Web, YouTube, Books) e sulla propria infrastruttura TPU.

Meta ha puntato sul weights open con la famiglia Llama (Llama 1 a febbraio 2023, Llama 2 a luglio 2023, Llama 3 ad aprile 2024, Llama 3.1 405B a luglio 2024). Questa strategia ha democratizzato l'accesso ai foundation models e alimentato un ecosistema di modelli derivati (Vicuna, Tulu, fine-tuning settoriali). Meta, tuttavia, ha rifiutato nel luglio 2025 di firmare il codice di buone pratiche GPAI europeo e ha temporaneamente sospeso il lancio di Llama 3 multimodale in Europa.

Mistral AI, fondata a Parigi nell'aprile 2023 da Arthur Mensch, Guillaume Lample e Timothée Lacroix, si è affermata come il campione europeo. La sua strategia ibrida combina modelli open (Mistral 7B, Mixtral 8x7B, Codestral Mamba, Mathstral, Ministral 3B/8B) e modelli proprietari (Mistral Large 2, Pixtral Large). Mistral ha firmato il codice di buone pratiche GPAI e stretto partnership strategiche con NVIDIA (Mistral NeMo 12B), Dassault Systèmes, Capgemini e SAP.

In Cina, Alibaba (famiglia Qwen), Baidu (ERNIE 4.5, ERNIE X1), Tencent (Hunyuan-T1) e soprattutto DeepSeek hanno raggiunto e poi sfidato i laboratori americani. DeepSeek-V3 ha stupito la comunità nel gennaio 2025 per la sua qualità a un costo di training circa 30 volte inferiore rispetto ai concorrenti occidentali. DeepSeek-R1, lanciato subito dopo e aggiornato nel giugno 2025 (R1-0528), ha causato un temporaneo crollo in borsa di NVIDIA, mettendo in discussione il primato delle infrastrutture sovradimensionate.

Altri attori ricoprono ruoli specializzati: xAI (Grok, infrastruttura Colossus), Cohere (modelli enterprise multilingue, Aya 23), AI2 (Tülu 3 405B, modelli completamente open), Aleph Alpha (Pharia-1-LLM tedesco), Black Forest Labs (FLUX-1 per il text-to-image), LightOn (Paradigm per l'azienda), Hugging Face (hub di modelli, SmolLM2), OpenEuroLLM (consorzio europeo open).

Modelli di riferimento nel 2026

Il panorama dei LLM di punta nel 2026 conta circa una dozzina di famiglie, ciascuna con le proprie dimensioni e varianti:

  • GPT-4o / GPT-4o mini (OpenAI) - multimodale nativo, latenza ridotta, finestra di contesto da 128k token. GPT-4o mini è diventato il riferimento economico per i deployment ad alto volume.
  • o1 / o3 (OpenAI) - modelli di ragionamento con chain-of-thought interna, potentissimi in matematica competitiva (AIME, IMO) e programmazione (Codeforces).
  • Claude 3.5 Sonnet / Claude 3 Opus (Anthropic) - finestra 200k, eccellenti per la scrittura lunga e la lettura di documenti.
  • Gemini 2.0 Flash / Gemini Ultra (Google DeepMind) - multimodale nativo, integrazione con l'ecosistema Google.
  • Llama 3.1 405B / Llama 3.3 (Meta) - leader open source dense.
  • Mistral Large 2 / Pixtral Large (Mistral AI) - europei, open weights per alcune versioni.
  • DeepSeek-V3 / DeepSeek-R1-0528 (DeepSeek) - open source cinese, ragionamento, costo di training spettacolariemente basso.
  • Qwen2.5 (Alibaba) - leader open source multilingue cinese, finestra da 1M token.
  • NOVA (Amazon) - famiglia foundation proprietaria annunciata a dicembre 2024.
  • Phi-3 / Phi-3.5 (Microsoft) - piccoli modelli efficienti per l'embedded.
  • Hunyuan-T1 (Tencent) - modello di ragionamento cinese al livello dello stato dell'arte.
  • Grok 3 (xAI) - accesso real-time a X, infrastruttura massiva.

Training e costi

Il training di un LLM di punta richiede risorse considerevoli. Per GPT-4, le stime pubbliche parlano di un budget intorno ai 100 milioni di dollari e diverse decine di migliaia di GPU H100 per tre mesi. Llama 3.1 405B ha richiesto 16.000 H100 e circa 30 milioni di ore GPU. Mistral Large 2 e Mixtral, all'estremo opposto dello spettro europeo, sono stati addestrati con budget significativamente più contenuti, dimostrando che è possibile raggiungere prestazioni competitive con un lavoro accurato sui dati.

Le scaling laws formalizzate da OpenAI e poi affinate da DeepMind (Chinchilla, 2022) hanno a lungo dettato la dinamica: la qualità di un modello cresce in modo prevedibile con il prodotto tra il numero di parametri e la quantità di dati di training, a condizione di bilanciare i due fattori. Questa equazione è stata messa in discussione a fine 2024: l'inflazione dei budget non si traduce più in guadagni spettacolari sui benchmark aperti, e l'attenzione si è spostata su altre dimensioni - qualità dei dati, ragionamento post-training, agenti, multimodalità.

L'infrastruttura di calcolo è diventata una questione geopolitica centrale. NVIDIA, grazie alla quasi esclusiva sulle GPU H100/H200/B200, cattura la maggior parte del valore. I controlli all'export statunitensi limitano le vendite verso la Cina, spingendo DeepSeek e Alibaba a ottimizzare i propri training su chip depotenziati (H800). xAI ha costruito nel 2024 il data center Colossus a Memphis, integrando 100.000 H100 e poi 200.000 H100/H200 in meno di un anno - un record industriale.

Capacità e limiti

I LLM moderni padroneggiano un ampio spettro di compiti: scrittura, riassunto, traduzione, generazione di codice, dialogo, estrazione di informazioni, classificazione, trattamento di documenti strutturati e non strutturati. Sono ormai componenti standard in molte applicazioni - motori di ricerca conversazionali, assistenti di coding (Copilot, Cursor), agenti legali e medici, sistemi di supporto al cliente, strumenti di produttività Office e Workspace.

I loro limiti sono altrettanto ben documentati. I LLM allucinano - producono contenuti plausibili ma fattualmente errati - soprattutto su temi di nicchia, numeri precisi e riferimenti bibliografici. Mancano di robustezza contro attacchi avversariali (prompt injection, jailbreak), come dimostrato dallo studio dell'EPFL nel dicembre 2024 sui limiti dei LLM contro attacchi adattivi. Possono essere manipolati per influenzare le opinioni degli utenti (studio EPFL di aprile 2024). Consumano energia e acqua in modo significativo - tema sempre più monitorato da regolatori e azionisti. I loro bias riflettono quelli dei corpus di training, prevalentemente anglofoni e nord-occidentali.

Open source vs proprietario

Il divario tra LLM open e closed struttura il dibattito dal 2023. I sostenitori dei modelli open - Meta, Mistral, Hugging Face, AI2, DeepSeek, La Quadrature du Net - invocano la sovranità tecnologica, la possibilità di audit indipendente, la diffusione accademica e la resilienza industriale. I loro oppositori - Anthropic, OpenAI su alcuni aspetti - sottolineano i rischi di proliferazione di usi malevoli (bioterrorismo, disinformazione su larga scala, frodi) e l'impossibilità di rimuovere un modello una volta pubblicato.

L'AI Act affronta parzialmente la questione concedendo esenzioni parziali ai modelli i cui parametri, architettura e informazioni d'uso sono pubblicati. Queste esenzioni non si applicano ai modelli a rischio sistemico (10²⁵ FLOPS di training). Nel 2026, l'ecosistema open source è dominato da Llama, Mistral, DeepSeek e Qwen, che coprono la maggior parte dei casi d'uso enterprise e accademici senza dipendere dall'API di un singolo fornitore.

Modelli specializzati e verticali

Oltre ai modelli generalisti, l'ecosistema si sta diversificando in modelli verticali. Nel settore medico: H-optimus-0 di Bioptimus per la diagnosi assistita, Pharia-1-LLM di Aleph Alpha in tedesco, fine-tuning specifici per la radiologia e l'oncologia. Nel legale: assistenti Lefebvre Dalloz-Barreau de Paris, applicazioni Talan-Mutuelle Générale. Nel coding: Codestral (Mistral), Code Llama (Meta), DeepSeek-Coder. Nella finanza: modelli interni di BNP Paribas, Crédit Agricole, JPMorgan. Il movimento dei piccoli modelli efficienti (SLM, Small Language Models) - Phi-3, Mistral Ministral, SmolLM2, Gemma 2 2B - punta ai deployment embedded (smartphone, auto, IoT) con una qualità accettabile e costi di inferenza molto bassi.

Il 2025 ha visto emergere gli agenti IA come nuovo paradigma di utilizzo dei LLM. Anziché rispondere a una singola richiesta, l'agente concatena azioni (chiamate di strumenti, consultazione Web, scrittura di file, esecuzione di codice) per risolvere un compito complesso. Gemini 2.0 Flash è stato presentato a dicembre 2024 come il modello che apre la strada a questa nuova famiglia di prodotti. AI Decision Matrix di AI Builders fornisce un quadro di valutazione comparativa per i responsabili IT alle prese con la moltiplicazione delle soluzioni.

Temi chiave 2026 e oltre

Diverse dinamiche da monitorare nei prossimi 18 mesi:

  • la conformità GPAI rispetto all'AI Act, ora applicabile da agosto 2025;
  • l'economia dell'inferenza, ormai dominante in volume rispetto all'economia del training, con un focus su architetture MoE e quantizzazione (BitNet, vLLM, llm-optimizer);
  • l'interazione con il diritto d'autore, soprattutto dopo l'abbandono della legge Darcos in Francia e la giurisprudenza in corso su Meta-Llama, NYT-OpenAI, Getty-Stable Diffusion;
  • la corsa ai modelli di ragionamento, che vede confrontarsi OpenAI o3, DeepSeek-R1, Gemini Thinking e Hunyuan-T1;
  • la convergenza multimodale, con modelli nativi in grado di gestire testo, immagini, video e audio in uno spazio unificato;
  • l'emergere degli agenti e le relative questioni di affidabilità (tasso di successo su task lunghi), sicurezza (controllo delle azioni eseguite) e modello di business;
  • la sovranità europea, rappresentata da Mistral, OpenEuroLLM, LightOn, Aleph Alpha, e dallo sforzo di disaccoppiare il calcolo di inferenza con OVHcloud e le nuove GPU NVIDIA Tensor Core.

L'evoluzione dei LLM non si riduce più a una corsa ai parametri. I vincitori combineranno qualità dei dati, post-training tramite reinforcement learning, infrastruttura di inferenza sotto controllo, strategia di licensing coerente con il proprio mercato di riferimento e piena conformità normativa. È ormai un tema industriale, geopolitico e giuridico tanto quanto scientifico.

Domande frequenti

Che cos'è un LLM (large language model) ?

Un LLM è una rete neurale di dimensioni molto grandi - da diversi miliardi a diverse centinaia di miliardi di parametri - basata sull'architettura transformer. Viene addestrato a predire la prossima unità (token) di un testo a partire da centinaia di miliardi fino a migliaia di miliardi di token. Da questo compito semplice emergono capacità complesse: dialogo, ragionamento, generazione di codice, traduzione.

Qual è la differenza tra LLM e foundation models ?

Un foundation model è un modello di IA riutilizzabile come base per molte applicazioni specializzate tramite fine-tuning, RAG o prompt engineering. Un LLM è un tipo di foundation model specializzato sul linguaggio. Tuttavia, il termine si estende anche ai modelli multimodali (immagine, audio, video) che condividono la stessa logica architetturale ed economica.

Quali sono i LLM più performanti nel 2026 ?

Nei benchmark pubblici: GPT-4o e o1/o3 (OpenAI), Claude 3.5 Sonnet e Claude 3 Opus (Anthropic), Gemini 2.0 Flash e Gemini Ultra (Google), Llama 3.1 405B (Meta), Mistral Large 2 (Mistral AI), DeepSeek-V3 e DeepSeek-R1 (DeepSeek), Qwen2.5 (Alibaba), Hunyuan-T1 (Tencent). Nessuno domina su tutte le dimensioni; la scelta dipende dal caso d'uso (ragionamento, latenza, costo, lingue, multimodalità).

Quanto costa addestrare un LLM all'avanguardia ?

Per i modelli densi con più di 70 miliardi di parametri, i budget vanno da 5 a 100 milioni di dollari a seconda della dimensione e dell'efficienza. GPT-4 è stimato a ~100 M$, Llama 3.1 405B a ~50 M$, DeepSeek-V3 a ~5 M$ (record di efficienza). Queste cifre coprono solo l'addestramento finale; includendo la sperimentazione preliminare e il post-addestramento, i costi complessivi sono da 3 a 10 volte superiori.

Che cos'è un modello Mixture of Experts (MoE) ?

È un'architettura in cui la rete è suddivisa in diversi sotto-reti esperte specializzate, e un router seleziona alcuni esperti da attivare per ogni token. Questo permette di aumentare il numero totale di parametri senza aumentare proporzionalmente il costo di inferenza. Mixtral 8x7B, DeepSeek-V3 e GPT-4o (presumibilmente) utilizzano questa architettura.

Perché DeepSeek ha creato un tale shock a gennaio 2025 ?

DeepSeek-V3 e poi DeepSeek-R1 hanno dimostrato che era possibile raggiungere il livello dei migliori modelli proprietari americani con un budget di addestramento circa 30 volte inferiore e in open source. Questo ha messo in discussione il vantaggio delle infrastrutture massive e ha provocato un temporaneo calo in borsa di NVIDIA, illustrando la fragilità della valutazione attuale dell'ecosistema IA.

Quali sono i LLM europei ?

Mistral AI (Mistral Large 2, Mixtral, Codestral, Ministral, Pixtral) è il leader europeo. Aleph Alpha sviluppa Pharia-1-LLM in tedesco. LightOn propone Paradigm per le aziende. Black Forest Labs pubblica FLUX-1 per il text-to-image. OpenEuroLLM è un consorzio accademico europeo. Il progetto mira a costituire un'alternativa sovrana ai modelli americani e cinesi.

Open source o proprietario: quale scelta fare ?

Dipende dal caso d'uso. Il proprietario (OpenAI, Anthropic, Gemini) offre la semplicità di un'API gestita e l'accesso ai modelli più avanzati. L'open source (Llama, Mistral, DeepSeek) permette l'hosting on-premise, la sovranità dei dati, l'audit del modello e l'evitamento del lock-in del fornitore - al prezzo di costi di infrastruttura e competenze interne. Per usi regolamentati (sanità, finanza, difesa), l'open source ospitato diventa spesso la norma.

Che cos'è un modello di ragionamento ?

Un modello di ragionamento produce esplicitamente una chain-of-thought prima di rispondere, il che migliora drasticamente le sue prestazioni su matematica competitiva, logica e programmazione. OpenAI o1/o3, DeepSeek-R1, Tencent Hunyuan-T1 e Gemini Thinking sono i principali rappresentanti. Il costo di inferenza aumenta (maggiore latenza) ma anche la qualità.

Quali sono i principali rischi associati ai LLM ?

Allucinazioni (generazione di contenuti fattualmente errati), prompt injection e jailbreak (aggiramento delle misure di sicurezza), bias (riflesso del corpus di addestramento), manipolazione dell'opinione (studio EPFL 2024), consumo energetico e idrico, fuga di dati privati, dipendenza industriale dai fornitori di modelli e GPU. L'AI Act affronta diversi di questi rischi per i modelli a rischio sistemico.

Come si valuta un LLM ?

Attraverso benchmark pubblici (MMLU, GPQA, MATH, HumanEval, SWE-Bench, LiveCodeBench, MT-Bench), valutazioni umane in cieco (Chatbot Arena), e test interni adattati al caso d'uso. I benchmark aperti saturano rapidamente: un modello che supera il 90% su MMLU non è più distinguibile dagli altri. La valutazione tramite task reale (redazione, produzione di codice, ragionamento lungo) resta indispensabile.

Qual è il prossimo passo per i LLM ?

Gli agenti IA - sistemi capaci di concatenare azioni complesse in autonomia - sono il grande cantiere 2025-2027. Oltre a questo, l'industria lavora su affidabilità a lungo termine (allineamento, sicurezza), efficienza di inferenza, convergenza multimodale nativa, apprendimento continuo e sovranità infrastrutturale. La questione dei dati di addestramento resta fondamentale: i corpus web pubblici iniziano a saturare, aprendo la strada a dati sintetici e partnership editoriali.

Articoli correlati

Articles récents

4 articles liés à ce sujet

Alibaba presenta i suoi cockpit intelligenti, occhiali IA e partnership strategiche al WAIC 2025

Alibaba presenta i suoi cockpit intelligenti, occhiali IA e partnership strategiche al WAIC 2025

Alla World Artificial Intelligence Conference 2025, Alibaba Cloud ha svelato diverse applicazioni dei suoi modelli di linguaggio IA, tra cui un cockpi...

Mercato dell'IA Prodotto commerciale
1 ago 2025 Leggi di più →
DeepSeek-R1-0528: la start-up cinese continua a sfidare i giganti americani con un aggiornamento del suo modello di punta

DeepSeek-R1-0528: la start-up cinese continua a sfidare i giganti americani con un aggiornamento del suo modello di punta

La start-up cinese DeepSeek ha aggiornato il suo modello R1, migliorando le sue prestazioni nel ragionamento, nella logica, nella matematica e nella p...

Strumento destinato al Datascientist Prodotto commerciale
2 giu 2025 Leggi di più →
Quando l'IA diventa scudo: cosa cambiano concretamente i LLMs nella cybersicurezza

Quando l'IA diventa scudo: cosa cambiano concretamente i LLMs nella cybersicurezza

I modelli di linguaggio (LLMs) sono sempre più utilizzati nella cybersicurezza, permettendo una rilevazione più rapida delle vulnerabilità e attacchi....

Sicurezza
15 mag 2025 Leggi di più →
Tencent lancia il modello di ragionamento Hunyuan-T1, in competizione con lo stato dell'arte

Tencent lancia il modello di ragionamento Hunyuan-T1, in competizione con lo stato dell'arte

Appena un mese dopo aver introdotto il suo modello di ragionamento TurboS, Tencent svela Hunyuan-T1, in grado di competere con DeepSeek R1 grazie a mi...

Mercato dell'IA
19 apr 2025 Leggi di più →

Statistiques

Articles totaux 4
Contenu mis à jour 5 giorni fa
Logo ActuIA Logo ActuIA

La tua fonte di informazioni sull'intelligenza artificiale e i suoi progressi.

Navigazione

  • Note legali
  • Contatto

Seguici

© 2019-2026 Net Square Digital. Tutti i diritti riservati.