Il Terremoto Cinese: GLM-5.2
C’è un terremoto nel mondo dei modelli linguistici e, per cambiare, non arriva dalla Silicon Valley. Si chiama GLM-5.2, viene dalla Cina (Z.ai), ha una licenza MIT ed è, senza troppi giri di parole, un mostro.
Ho passato le ultime ore ad analizzare i benchmark e a testarlo su Open Code, e la sensazione è una sola: è come usare Claude Opus 4.8, ma 6 volte più economico.
Perché GLM-5.2 cambia le regole del gioco
Non stiamo parlando del solito annuncio pompato. I benchmark indipendenti (come Arena) lo piazzano al secondo posto assoluto nel front-end, subito sotto Fable 5.
Ecco i numeri che dovrebbero far tremare OpenAI e Anthropic:
- Costi: .40 vs 0.50 (rispetto a Fable 5). Costa 6-7 volte meno di Opus.
- Parametri: 753 miliardi (Mixture of Experts), con 40 miliardi attivi all’inferenza.
- Contesto: 1 milione di token in input (un salto enorme rispetto ai 200k della versione 5.1).
Il segreto? La “Dynamic Sparse Attention” (DSA)
Molti si chiedono come faccia a gestire 1 milione di token senza esplodere. Usano un modulo chiamato Indexer condiviso tra i layer della transform. Invece di calcolare l’attenzione su tutto il documento ogni volta, il modello “capisce” quali sono le parti rilevanti e focalizza l’energia solo lì. Risultato? Un’ottimizzazione della memoria di circa 3 volte.
Lo scandalo Gemini (Google, ci sei?)
Mentre i cinesi corrono a velocità folle, Google continua a tenere Gemini 3.5 in preview. È imbarazzante vedere come un modello open source superi costantemente i modelli “frontiera” di Big G in quasi tutti i Long Horizon Task. Se Gemini è ancora lì a dare errori 429 in produzione, GLM-5.2 è già qui, solido e pronto per essere usato seriamente.
Allucinazioni: Un punto di onestà
Dobbiamo essere chiari: l’Omniscience Index di Artificial Analysis dà a GLM-5.2 un punteggio di 4. È più affidabile di DeepSeek V4 (-23), ma ancora lontano dalla “conoscenza generale” di un Fable (40) o di Gemini (33). Se devi scrivere codice o fare task agentici, GLM è un mostro. Se devi chiedergli consigli medici… forse aspetta un attimo.
Conclusione
La distanza tecnologica tra Cina e USA non è più di mesi, ma di settimane. GLM-5.2 è la prova che l’AI può essere potente, scalabile e, soprattutto, accessibile.
Articolo generato sulla base dell’analisi video di Kaito e dati tecnici Z.ai.