AI Week #47: Sonnet 5, Fable 5 sbloccato, Spark su Mac, Siri bloccata in Europa e l'addio del padre di Internet - Vito Ruocco

Milano, 1° luglio 2026 — L’estate del 2026 non sta regalando pause alla tecnologia. In una sola giornata, Anthropic ha rilasciato un modello che ridisegna la scala dei costi dell’AI, Google ha portato il suo agente autonomo sui Mac, Apple e Bruxelles continuano a sfidarsi sul futuro di Siri in Europa, e un nuovo attacco informatico dimostra che i browser AI sono tutt’altro che sicuri. È una giornata densa, che merita di essere raccontata pezzo per pezzo.

Anthropic lancia Claude Sonnet 5: prestazioni da top di gamma, prezzo da fascia media

Il 30 giugno Anthropic ha presentato Claude Sonnet 5, il modello di fascia intermedia che diventa da subito il default per i piani Free e Pro di Claude, ed è disponibile anche per gli abbonamenti Max, Team ed Enterprise. Il punto attorno a cui ruota l’annuncio è il rapporto fra costo e resa: secondo Anthropic, le prestazioni di Sonnet 5 si avvicinano a quelle di Opus 4.8, il modello di punta, ma a prezzi sensibilmente inferiori, con un miglioramento netto rispetto al predecessore Sonnet 4.6 su ragionamento, uso degli strumenti, coding e lavoro di conoscenza.

Sul fronte prezzi, Anthropic applica una tariffa introduttiva di 2 dollari per milione di token in input e 10 dollari per milione in output, valida fino al 31 agosto 2026; dal 1° settembre si passa ai listini standard di 3 e 15 dollari per milione. È un dettaglio meno lineare di quanto sembri, perché Sonnet 5 adotta un tokenizer aggiornato: lo stesso testo può tradursi in un numero di token fino al 35% in più rispetto al modello precedente a seconda del tipo di contenuto, e il prezzo introduttivo è calibrato proprio per rendere la transizione all’incirca neutrale sui costi.

Il modello più agentico finora. Anthropic posiziona Sonnet 5 come il modello Sonnet più agentico mai realizzato: capace di elaborare piani, usare strumenti come browser e terminali e operare in autonomia a un livello che, fino a pochi mesi fa, richiedeva modelli più grandi e costosi. I tester che hanno avuto accesso anticipato lo hanno descritto come nettamente più autonomo dei predecessori, in grado di portare a termine compiti complessi dove le versioni precedenti si fermavano e di controllare il proprio output senza che gli venga chiesto esplicitamente.

Sui benchmark BrowseComp e OSWorld-Verified, ai livelli di effort più alti Sonnet 5 può eguagliare Opus 4.8 su alcuni task, mentre a effort intermedio offre un’efficienza di costo sostanzialmente superiore. Gli sviluppatori possono regolare questo livello di effort per bilanciare costo e prestazioni tra Sonnet 5 e Opus 4.8.

Sul fronte sicurezza, Sonnet 5 mostra tassi più bassi di comportamenti indesiderati rispetto a Sonnet 4.6: meno allucinazioni, meno sycophancy e una migliore resistenza agli attacchi di prompt injection. Un arretramento voluto, però, c’è: Sonnet 5 non è stato addestrato per compiti di cybersecurity e ottiene risultati marcatamente peggiori di Opus 4.8 nello sviluppo di exploit. In un test condotto in collaborazione con Mozilla su vulnerabilità di Firefox 147, il modello non ha mai prodotto un exploit funzionante.

Fable 5 torna accessibile: il governo USA revoca i controlli all’export

Dopo settimane di tensione, il Dipartimento del Commercio statunitense ha revocato i controlli all’esportazione su Claude Fable 5 e Mythos 5, i due modelli di punta di Anthropic. L’azienda ha annunciato che riporterà Fable 5 a disposizione degli utenti di tutto il mondo a partire dal 1° luglio, chiudendo una vicenda aperta il 12 giugno con una direttiva che vietava a qualsiasi cittadino straniero di accedere ai modelli, concedendo solo 90 minuti per conformarsi.

All’origine della restrizione, un report di ricercatori di Amazon che avevano individuato un metodo per aggirare i guardrail di Fable 5: aggirati i filtri, il modello arrivava a identificare vulnerabilità software e, in un caso, a produrre codice dimostrativo per sfruttarle. Anthropic ha poi ridimensionato la portata di quella tecnica, spiegando che non esponeva capacità offensive uniche di livello Mythos, ma rifletteva un caso limite nei guardrail di Fable 5 legato a lavoro difensivo di cybersicurezza di routine.

Sul piano operativo, Anthropic dichiara di aver addestrato un classificatore di sicurezza migliorato che blocca la tecnica descritta nel report Amazon in oltre il 99% dei casi. Il classificatore è stato testato e approvato dai ricercatori del CAISI, il Center for AI Standards and Innovation dello stesso Dipartimento del Commercio. Insieme ad Amazon, Microsoft, Google e ad altri partner, Anthropic sta inoltre sviluppando un framework condiviso per valutare la severità dei jailbreak secondo quattro criteri: Capability gain, Breadth of capability gain, Ease of weaponization e Discoverability.

Fable 5 torna dal 1° luglio su Claude Platform, Claude.ai, Claude Code e Claude Cowork, mentre il ripristino su AWS, Google Cloud e Microsoft Foundry è indicato come imminente.

Claude Science: l’IA che analizza i dati senza farli uscire dal laboratorio

Anthropic ha aperto la beta di Claude Science, un ambiente di lavoro per la ricerca scientifica che l’azienda colloca allo stesso livello di Claude Code e Claude Cowork. Non si tratta di un nuovo modello: gira sugli stessi modelli Claude già disponibili a tutti, Opus 4.8 compreso, senza accesso speciale né restrizioni. La stessa Anthropic lo precisa nell’annuncio, dove scrive che “non è un nuovo modello di IA né un modello più capace per la biologia”.

Claude Science integra oltre 60 database scientifici con connettori preconfigurati per genomica, single-cell, proteomica, biologia strutturale e cheminformatica. Il funzionamento ruota attorno a più agenti: un agente coordinatore generalista orchestra agenti specializzati, anche personalizzati dall’utente, mentre un agente revisore separato controlla citazioni, calcoli e figure, segnalando e correggendo gli errori. Sul fronte della riproducibilità, ogni figura generata porta con sé il codice e l’ambiente esatti che l’hanno prodotta.

Il workbench gira sull’infrastruttura del laboratorio: un laptop macOS o Linux, un server remoto via SSH, un nodo HPC oppure compute on demand tramite Modal. I dataset sensibili non lasciano mai i sistemi del laboratorio. Per i modelli di life sciences, Claude Science si appoggia al BioNeMo Agent Toolkit di NVIDIA per collegarsi nativamente a strumenti come Evo 2, Boltz-2 e OpenFold3.

I primi risultati sono notevoli. Jérôme Lecoq, neuroscienziato all’Allen Institute, ha costruito un template di review multi-agente con circa 20 skill personalizzate: un lavoro che prima poteva richiedere fino a due anni ora produce 10 review da oltre 100 pagine con citazioni verificate. Stephen Francis, epidemiologo all’UCSF Brain Tumor Center, ha ridotto a circa un decimo il tempo di analisi in uno studio di epidemiologia molecolare del glioma. La scommessa è sulla distribuzione più che sul modello, e qui si aprono tre strade diverse nello stesso mercato: Anthropic punta sull’accesso ampio via abbonamento; OpenAI con GPT-Rosalind ha scelto un modello specializzato ad accesso riservato; Google DeepMind procede con Gemini for Science e modelli proprietari come AlphaFold e AlphaGenome.

Google Spark arriva su Mac: l’agente AI che lavora in autonomia

Google sta rollando Gemini Spark, il suo agente AI “24/7”, sull’app Gemini per macOS. Spark può accedere e lavorare con i file sul computer, e l’azienda sta aggiungendo diverse nuove funzionalità: la possibilità di connettere Tasks e Keep all’agente, integrazioni con app come Canva e Instacart, e il monitoraggio di argomenti in tempo reale.

Spark è progettato per prendere compiti in carico e lavorarci in background, anche quando hanno più passaggi, permettendo all’utente di posare il telefono o allontanarsi dal computer. Google pubblicizza che è “sempre sotto la tua direzione” e “progettato per consultarti prima di compiere azioni importanti”.

Dai test hands-on di The Verge, i risultati sono stati sorprendentemente buoni. Spark è riuscito a trovare l’indirizzo email della moglie di un tester senza che gli venisse fornito il nome, a individuare il foglio di budget corretto in Google Drive senza che il file contenesse la parola “budget” nel nome, e a redigere una bozza di email in Gmail con i dati medi delle spese grocery mensili. Tutto in pochi minuti, con un livello di autonomia che fino a pochi mesi fa sembrava fantascienza.

Ma non è perfetto. In un altro test, Spark ha creato un’email che menzionava un foglio di iscrizione inesistente, ha usato il termine “loool” in un messaggio formale, e non è riuscito a condividere un documento Google con un’altra persona. Come tutti gli strumenti AI, l’output richiede comunque verifica umana.

Apple vs UE: Siri AI bloccata in Europa, 450 milioni di utenti tagliati fuori

Apple ha finalmente reso utile la sua AI: il nuovo Siri, presentato al WWDC 2026, è capace di guardare attraverso app, informazioni personali, foto, messaggi e video e compiere azioni per conto dell’utente. Ma milioni di utenti in Europa sono stati informati che non lo vedranno presto, se mai lo vedranno — e Apple vuole che diano la colpa all’UE.

Apple sostiene che il nuovo Siri basato sull’intelligenza artificiale non debutterà su iPhone e iPad nell’Unione Europea a causa del Digital Markets Act (DMA), la legge sulla concorrenza del blocco che richiede alle piattaforme dominanti di dare ai competitor lo stesso tipo di accesso ai dati di cui godono loro stessi. In pratica, Apple dovrebbe fornire a gruppi come OpenAI, Google e Anthropic un accesso simile ai suoi sistemi — un livello di apertura che Apple considera inaccettabile per la privacy e la sicurezza.

Apple ha proposto soluzioni come il Trusted System Agent, un intermediario tra gli agenti AI rivali e i sistemi Apple, che richiederebbe 18 mesi per essere implementato. La Commissione Europea avrebbe respinto questa e altre proposte. Da parte sua, la Commissione sostiene che “nulla nel DMA impedisce ad Apple di introdurre nuovi prodotti e servizi nell’UE” e che “Apple non ha sviluppato proposte per soluzioni di interoperabilità conformi al DMA”.

Il risultato è uno stallo che lascia circa 450 milioni di persone senza accesso ad Apple Intelligence funzionante. Tim Cook e la commissaria europea Henna Virkkunen hanno avuto uno “scambio costruttivo su temi di interesse comune”, secondo il Financial Times, ma la strada da percorrere rimane incerta. Nel frattempo, la Cina sarà esclusa da Siri AI per motivi normativi simili.

BioShocking: la prompt injection che inganna i browser AI

Un gruppo di ricercatori di LayerX ha presentato BioShocking, una nuova tecnica di attacco basata sulla prompt injection che evidenzia debolezze nei browser dotati di agenti di intelligenza artificiale. La tecnica può portare gli assistenti AI a interpretare operazioni potenzialmente pericolose come se facessero parte di un contesto immaginario, riducendo l’efficacia dei meccanismi di protezione integrati.

Per dimostrare il funzionamento, i ricercatori hanno realizzato una prova di concetto ispirata all’universo del videogioco BioShock: una pagina web propone un rompicapo in cui vengono premiate le risposte errate, inducendo gradualmente l’agente AI a considerare accettabili comportamenti normalmente contrari alle regole. Nella fase conclusiva, il browser riceve l’istruzione di visitare un archivio GitHub e copiare informazioni presenti nel codice, comprese credenziali e dati riservati.

Il test è stato eseguito su sei browser e strumenti AI: ChatGPT Atlas, Comet, Fellou, Genspark Browser, Sigma Browser e il plugin Chrome di Claude. Tutti hanno mostrato vulnerabilità durante la prova. LayerX ha comunicato il problema ai produttori già nell’ottobre 2025: tre aziende non hanno fornito risposta, OpenAI è l’unica ad aver introdotto una correzione efficace per ChatGPT Atlas, e Anthropic ha distribuito un aggiornamento giudicato insufficiente.

LayerX suggerisce ai produttori di introdurre conferme esplicite prima delle operazioni sensibili, controlli più rigorosi sul contesto e limiti operativi per le sessioni degli agenti AI. Agli utenti viene consigliato di limitare l’accesso dei browser AI ai servizi contenenti dati riservati.

NVIDIA: il segreto di Blackwell non è l’hardware, ma il software

NVIDIA sostiene che il futuro dell’intelligenza artificiale dipenderà sempre meno dall’hardware e sempre più dal software. L’azienda evidenzia come il proprio stack di inferenza per Blackwell, sviluppato insieme alla comunità open source, abbia già ridotto fino a cinque volte il costo per token del modello DeepSeek V4 nell’arco di circa un mese grazie a continui aggiornamenti software, senza modifiche dell’infrastruttura fisica.

Il parametro di riferimento, secondo NVIDIA, non è più rappresentato esclusivamente dalla potenza teorica delle GPU, bensì dall’efficienza economica dell’inferenza: il costo per token, il numero di token elaborati per dollaro investito, per watt consumato e nel rispetto dei requisiti di latenza. Le moderne applicazioni di AI agentica, infatti, sono molto diverse dai tradizionali servizi web: una singola richiesta può trasformarsi in centinaia di sotto-attività eseguite su GPU, CPU, DPU e sistemi di storage differenti.

NVIDIA suddivide il proprio stack software in tre livelli: gestione operativa della produzione (orchestrazione, autoscaling, allocazione memoria), accelerazione delle applicazioni (ottimizzazioni runtime, fusione dei kernel, sovrapposizione calcolo-comunicazione), e accesso diretto alle funzionalità hardware. La combinazione di tecnologie come il disaggregated serving, il Large Expert Parallelism con NVLink, la precisione NVFP4 e la Multi-Token Prediction può incrementare il throughput fino a 20 volte rispetto alla configurazione di base.

Le dichiarazioni sono supportate da esempi concreti. Baseten dichiara fino al 50% di token al secondo in più grazie a TensorRT-LLM con DeepSeek V4 Pro. DigitalOcean, con Hippocratic AI nel settore sanitario, ha aumentato il throughput del 30% mantenendo un tempo di prima risposta inferiore a mezzo secondo durante circa 10 milioni di chiamate. L’integrazione con framework open source come PyTorch, vLLM e SGLang permette di trasferire rapidamente le innovazioni della ricerca alle implementazioni in produzione.

Vinton Cerf lascia Google: si congeda il “padre di Internet”

Vinton Cerf, considerato uno dei principali artefici della nascita di Internet, si prepara a lasciare Google dopo oltre vent’anni di attività. L’annuncio è arrivato durante l’evento Open Frontier, organizzato dal Laude Institute, dove Cerf è intervenuto in video. A rendere pubblico il suo imminente ritiro è stato Dave Patterson, professore dell’Università della California a Berkeley e noto per aver contribuito allo sviluppo dell’architettura RISC.

Oggi ottantatreenne, Cerf è universalmente riconosciuto, insieme a Robert Kahn, come uno dei progettisti dei protocolli di rete che hanno dato origine all’Internet moderno. A partire dagli anni Settanta, i due hanno sviluppato e promosso il protocollo TCP/IP, l’insieme di regole che permette alle reti informatiche di comunicare tra loro. Questo contributo gli è valso numerosi riconoscimenti internazionali, tra cui lauree honoris causa, la Presidential Medal of Freedom e il prestigioso Turing Award.

Dal 2005 Cerf ha ricoperto in Google il ruolo di vicepresidente e Chief Internet Evangelist, contribuendo alla diffusione della cultura della rete e delle tecnologie aperte. Durante il dibattito, Cerf ha espresso la convinzione che la crescita degli agenti AI autonomi renderà indispensabile la definizione di nuovi standard condivisi. Secondo il ricercatore, software sviluppati da aziende diverse dovranno poter collaborare tra loro attraverso protocolli comuni, proprio come accadde con Internet. Cerf ritiene inoltre che il linguaggio naturale non rappresenti la soluzione ideale per la comunicazione tra agenti artificiali: l’ambiguità delle lingue umane potrebbe generare incomprensioni, mentre saranno necessari sistemi molto più precisi affinché gli agenti possano interpretare correttamente gli accordi e le istruzioni reciproche.

Le altre notizie della giornata in breve

Cursor lancia l’app iPhone. Cursor, che SpaceX ha recentemente annunciato di voler acquisire per 60 miliardi di dollari, ha lanciato un’app per iPhone che permette agli utenti di lanciare e monitorare agenti AI coding, mostrando gli aggiornamenti sul progresso tramite le Live Activities del dispositivo.

OPPO Reno16, Pro e FS ufficiali. OPPO ha presentato la nuova serie Reno16 con design olografico 3D, fotocamere fino a 200MP, batterie record oltre i 6000mAh (fino a 6.500 mAh sul modello FS) e l’inedito accessorio magnetico Bubble per i creator.

AMD Zen 6 Low Power per PlayStation 6 portatile. Un nuovo core AMD “Low Power”, progettato per il consumo minimo durante i carichi di lavoro in background, potrebbe debuttare nel chip destinato alla futura PlayStation 6 portatile di Sony, secondo patch del kernel Linux trovate da Phoronix.

Mac Studio: refresh nel 2026, nuova generazione nel 2028. Secondo nuovi leak, Apple starebbe preparando un refresh del Mac Studio per quest’anno, con un salto generazionale vero e proprio fissato per il 2028.

Weird Al Yankovic rifiuta i soldi dell’AI. Il musicista satirico Grammy-winning ha raccontato di aver rinunciato a “una bella somma di denaro” per uno spot pubblicitario quando, una settimana prima delle riprese, ha scoperto che sarebbe stato basato sull’AI. “Non posso essere il testimonial dell’AI”, ha dichiarato.

California e Anthropic: partnership per la pubblica amministrazione. La California ha stretto una partnership con Anthropic per rendere Claude disponibile a tutte le agenzie statali e i governi locali con uno sconto del 50%, formazione gratuita della forza lavoro e assistenza tecnica. Gli impiegati statali useranno Claude per redigere e riassumere documenti, analizzare informazioni e supportare il lavoro quotidiano.

iPhone 18 Pro: nuovi leak dal dark web. Dopo una violazione dei dati presso un partner produttivo di Apple, immagini e video di drop test dell’iPhone 18 Pro sono apparse online, offrendo un primo sguardo al prossimo flagship Apple.

Google limita l’accesso di Meta a Gemini. Google ha dovuto mettere un tetto all’uso di Gemini da parte di Meta, cresciuta sempre più dipendente dal modello per molti dei suoi bisogni. Nonostante decine di miliardi investiti in chip, data center ed energia, anche i giganti tecnologici faticano a trovare abbastanza potenza di calcolo per supportare la domanda.

Considerazioni finali

La giornata del 1° luglio 2026 conferma un trend che sta definendo l’intero anno: l’AI non è più solo una questione di modelli più grandi o più intelligenti, ma di efficienza, accessibilità e sicurezza. Anthropic sta dimostrando che si può avere prestazione quasi di punta a prezzi di fascia media, NVIDIA sta dimostrando che il software può moltiplicare il valore dell’hardware già installato, e i ricercatori di sicurezza stanno dimostrando che ogni nuova capacità introduce nuovi vettori di attacco.

Nel mezzo, un padre di Internet che va in pensione ricordandoci che gli agenti AI avranno bisogno degli stessi standard aperti che hanno reso possibile il web, un gigante della tecnologia che preferisce bloccare 450 milioni di utenti piuttosto che aprire il suo ecosistema, e un musicista satirico che rinuncia a soldi facili per non diventare “il testimonial dell’AI”.

La tecnologia continua a correre. La domanda è se le regole, la sicurezza e la saggezza riusciranno a tenere il passo.

AI Week #47: Sonnet 5, Fable 5 sbloccato, Spark su Mac, Siri bloccata in Europa e l’addio del padre di Internet