In un certo senso, il CEO di Anthropic, Dario Amodei, sta ottenendo ciò che voleva.
Amodei sostiene da tempo che l’intelligenza artificiale sta diventando pericolosamente potente – e quindi è così restrizioni normative sulla tecnologia sono urgentemente necessari. In un saggio pubblicato la scorsa settimana, Amodei ha scritto che il rilascio di modelli di intelligenza artificiale all’avanguardia “dovrebbe essere bloccato o invertito come minaccia alla sicurezza pubblica” se non soddisfano rigorosi standard di sicurezza.
Ahimè, chiedendo il attuale Dare per scontato che il governo degli Stati Uniti esegua nuove autorità di regolamentazione è un po’ come augurare alla zampa di una scimmia (o, per gli zoomoristi del pubblico, una “Un desiderio salice”): Alcuni giorni dopo la pubblicazione del manifesto di Amodei, l’ultimo modello di intelligenza artificiale di Anthropic è andato in ombra, su ordine dello zio Sam.
Quel modello – noto come “Mythos” nella sua forma illimitata e “Fable” nella sua forma fortemente limitata e accessibile al pubblico – rappresenta un importante risultato tecnico. SU parametri di riferimento convenzionali delle prestazioni dell’intelligenza artificiale, ha ampiamente superato tutti i suoi predecessori. E durante il suo breve mandato pubblico, innumerevoli utenti meravigliato al suo abilità. Nei miei test sulle sue capacità giornalistiche, Fable si è dimostrato il 30% più efficace rispetto ai modelli precedenti nell’indurre sentimenti di obsolescenza e terrore esistenziale.
Anthropic inizialmente condivideva Mythos esclusivamente con organizzazioni pubbliche e private controllate, in modo che possano rafforzare le loro difese informatiche contro le sue capacità. Prima di presentare al grande pubblico il suo nuovo modello, Anthropic lo ha rivestito di rigide barriere di sicurezza: Fable si rifiuterà di rispondere praticamente qualsiasi domanda sulla sicurezza informatica o sulla biologia (per impedirne l’uso a fini di hacking e bioterrorismo).
La Casa Bianca lo ha ritenuto insufficiente. Venerdì, dopo aver appreso quella favola conteneva una potenziale vulnerabilità della sicurezza, l’amministrazione ha imposto controlli sulle esportazioni del modello, rendendo illegale per Anthropic fornire Fable Qualunque cittadino straniero, compresi i propri dipendenti immigrati. In pratica, ciò significava che Anthropic doveva portare Fable completamente offline (i modelli di intelligenza artificiale non sono ancora in grado di scansionare il cervello dei propri utenti e confermarne la nazionalità).
In altre parole: il nostro governo ha rivendicato il potere di bloccare o eliminare modelli di intelligenza artificiale che minacciano la sicurezza pubblica.
Ma Amodei non festeggia. E probabilmente non dovrebbero farlo nemmeno altri sostenitori della sicurezza dell’intelligenza artificiale.
È vero, quello della Casa Bianca approccio iniziale, laissez-faire alla governance dell’IA è ora in rovina. Dalle macerie, tuttavia, emerge il peggior tipo di regime normativo: governato dai capricci del ramo esecutivo (piuttosto che da regole chiare e vincolanti), dalle apparenti incomprensioni tecniche dei funzionari laici (piuttosto che dalla conoscenza degli esperti del settore) e dai pregiudizi politici di un presidente corrotto (piuttosto che dai dettami imparziali della legge o dall’analisi costi-benefici).
L’America ha bisogno di un sistema normativo che riduca i rischi dell’intelligenza artificiale, facilitandone al tempo stesso i benefici, e non un sistema che permetta al presidente di mettere in ginocchio le sue aziende meno favorite per motivi dubbi. E la Casa Bianca sembra stia costruendo quest’ultimo.
Il motivo per vietare Fable
A prima vista, le azioni dell’amministrazione potrebbero sembrare ragionevoli. Dopotutto, la stessa Anthropic era innervosita dalle doti di Mythos per il crimine informatico. E anche con i guardrail, Fable è eccezionalmente potente. A prima vista, non è plausibile che il modello possa porre sfide uniche alla sicurezza.
Inoltre, uno dei Gli stessi investitori di Anthropic ha avvertito la Casa Bianca che Fable era vulnerabile a un potenziale “jailbreak”, ovvero un metodo per aggirare i controlli di sicurezza del modello.
Giovedì scorso, Amazon – che ha una partecipazione di 13 miliardi di dollari in Anthropic – ha condiviso la documentazione della ricerca un tale jailbreak con i funzionari dell’amministrazione. La Casa Bianca ha risposto contattando Anthropic e chiedendole di risolvere il problema. L’azienda di intelligenza artificiale ha insistito sul fatto che il suo modello era sicuro e che l’amministrazione aveva frainteso la ricerca di Amazon.
L’amministrazione ha pertanto concluso che Anthropic non era in grado o non era disposta a risolvere il problema. Ha quindi deciso che imporre controlli sulle esportazioni del modello era l’unico modo per garantire che non deteriorasse la sicurezza informatica dell’America.
Le passività in termini di sicurezza di Fable potrebbero essere più o meno le stesse di ChatGPT
Eppure questa versione degli eventi è incompleta. E ad un esame più attento, il comportamento dell’amministrazione appare meno difendibile.
Nello specifico, sembrano esserci (almeno) tre problemi con la repressione di Fable.
In primo luogo, è plausibilmente radicato in un malinteso tecnico. Nessun modello di intelligenza artificiale esistente è al 100% a prova di jailbreak. E le capacità specifiche identificate da Amazon non sono esclusive di Fable, secondo alcuni esperti. Katie Moussouris, capo del gruppo di sicurezza informatica Luta Security, ha esaminato una copia dei risultati di Amazon e ha detto al Tempi finanziari che non sollevavano nuovi rischi: secondo Moussouris, Amazon ha dimostrato che, quando richiesto in un certo modo, Fable identificava le vulnerabilità del software, apparentemente per aiutare l’utente a rafforzare le proprie difese. Ma molti modelli di frontiera, incluso GPT 5.5 di OpenAI, forniranno lo stesso servizio.
Da parte sua, Anthropic dice ha sottoposto Fable a migliaia di ore di test – da parte di organizzazioni indipendenti e del governo degli Stati Uniti – per garantire che non contenga no universale jailbreak, vale a dire “un metodo che può aggirare ampiamente le garanzie del modello, sbloccando un’ampia gamma di capacità informatiche”. Ma insiste sul fatto che il tipo di jailbreak identificati da Amazon sono impossibili da prevenire completamente.
Se questo è vero, allora il targeting di Fable da parte dell’amministrazione sarebbe selettivo e capriccioso.
La repressione di Fable potrebbe essere motivata politicamente
In secondo luogo, ci sono buone ragioni per credere che le azioni pesanti dell’amministrazione siano state influenzate dal rifiuto di Anthropic di accattivarsi il suo favore.
All’inizio di quest’anno, Anthropic e il Dipartimento della Difesa del presidente Donald Trump entrato in conflitto dopo che l’azienda di intelligenza artificiale ha rifiutato di approvare l’uso dei suoi modelli per la sorveglianza di massa e sistemi d’arma completamente autonomi. Il Pentagono ha risposto dichiarando Anthropic un “rischio per la catena di fornitura”, una designazione che limiterebbe la capacità degli appaltatori governativi di fare affari con essa.
Questa misura era giuridicamente dubbia e chiaramente falsa; in sostanza, l’amministrazione stava affermando che l’intelligenza artificiale di Anthropic era strutturalmente pericolosa per il lavoro governativo, anche se ha continuato a utilizzare quella stessa intelligenza artificiale per il lavoro governativo. Il chiaro intento della politica era quello di punire un’azienda che aveva insistito su termini contrattuali che non erano graditi all’amministrazione.
Questo precedente da solo offre motivo di dubitare dell’imparzialità della Casa Bianca nell’imporre controlli sulle esportazioni a Fable. E il fatto che l’amministrazione sia a suo agio con due dei principali concorrenti di Anthropic… OpenAI e xAI di Elon Musk – aggiunge ulteriore motivo di scetticismo.
Ma la prova migliore della malafede dell’amministrazione viene proprio da qui il suo spiegazioni delle sue azioni. In un’intervista con Axiosuna “fonte che ha familiarità con il pensiero dell’amministrazione” ha affermato che le difficoltà di Anthropic riflettono in parte la sua incapacità di “comunicare in modo efficace” con la Casa Bianca o di “apprezzare le differenze ideologiche”.
Basti dire che, se questa disputa riguarda esclusivamente una vulnerabilità della sicurezza, non è chiaro come contano le “differenze ideologiche” tra l’amministrazione Trump e la leadership liberale di Anthropic. Tuttavia, Axios prosegue riferendo che Anthropic ha aggravato le proprie difficoltà sollecitando una revisione della ricerca di Amazon da Moussouris di Luta Security, che l’amministrazione considera un “democratico radicale”.
Ancora una volta, se i controlli sulle esportazioni fossero motivati esclusivamente da preoccupazioni legate alla sicurezza informatica, allora le inclinazioni ideologiche di Moussouris sembrerebbero irrilevanti.
Nel contesto, è difficile non leggere le lamentele dell’amministrazione sull’incapacità di Anthropic di “comunicare” come una richiesta all’azienda di genuflettersi davanti a Trump.
Detto questo, la ricerca di Amazon non è attualmente disponibile per il controllo pubblico. Non sappiamo esattamente quali siano le vulnerabilità di Fable, né esattamente cosa pensassero i funzionari dell’amministrazione quando hanno effettivamente bandito il modello.
Ciò che è certo, tuttavia, è che il processo dietro il divieto di Fable era gravemente viziato. L’amministrazione non ha formulato alcuno standard oggettivo e vincolante per la sicurezza del modello di intelligenza artificiale, tanto meno ha ottenuto che il Congresso ratificasse tali requisiti.
Né ha condotto alcuna analisi costi-benefici approfondita o trasparente prima di rimuovere unilateralmente Fable dal mercato, come in genere devono fare le agenzie di regolamentazione prima di attuare un cambiamento politico radicale. E i potenziali costi della repressione di Fable non sono trascurabili: ad esempio, se le imprese straniere sanno che il presidente degli Stati Uniti può (e lo farà) revocare il loro accesso ai modelli di intelligenza artificiale americani per capriccio, allora avranno un incentivo a sostituire Claude e ChatGPT con alternative non americane.
Forse Amazon ha identificato una responsabilità abbastanza grave da ignorare tali preoccupazioni. Ma l’amministrazione ha fatto pochi sforzi per stabilirlo.
Abbiamo bisogno di un’alternativa migliore all’apocalisse dei robot
I modelli di intelligenza artificiale stanno diventando rapidamente più potenti e, quindi, più pericolosi. È possibile che i progressi dell’intelligenza artificiale abbiano implicazioni positive o neutre per la sicurezza informatica: i modelli avanzati potrebbero finire per rafforzare le difese tanto o più quanto per indebolirle.
Ma ciò non è garantito.
Per mitigare i rischi che presentano i sistemi di IA di frontiera, il governo potrebbe essere giustificato nello stabilire processi di licenza che condizionino il rilascio di un nuovo modello alla sua conformità agli standard di sicurezza.
C’è una differenza, tuttavia, tra il Congresso che stabilisce un processo di regolamentazione imparziale e vincolato alle regole e il ramo esecutivo che vieta i sistemi di intelligenza artificiale a piacimento. Se gli amministratori delegati del settore tecnologico non devono avere piena discrezionalità su quali modelli rilasciare, i presidenti non devono avere un’autorità incontrollata su quali bloccare. L’alternativa allo sconsiderato, Accelerazionismo dell’IA Dovrebbe non essere clientelismo capriccioso – ma, per ora, sembra esserlo.
