L’era dell’IA a basso costo è già finita
Quando OpenAI ha lanciato ChatGPT alla fine del 2022, ha rapidamente battuto
ogni record, diventando il prodotto tecnologico con la crescita più rapida della
storia. I fornitori di modelli di intelligenza artificiale come OpenAI,
Anthropic e Google inizialmente utilizzavano prezzi fissi artificialmente bassi
per incentivare l’adozione e conquistare quote di mercato, confidando di poter
bruciare il capitale degli investitori per creare dipendenza e poi monetizzare
una base di utenti fidelizzata. Ma rispetto alle altre piattaforme rivolte ai
consumatori che avevano adottato questa strategia sin dagli anni 2000, come
Facebook, Uber o Instagram, l’intelligenza artificiale generativa si differenzia
per due aspetti cruciali.
Innanzitutto, ogni utente aggiuntivo genera un enorme costo ricorrente per ogni
query, su una scala mai raggiunta prima da nessun social network. Nello
specifico, i chatbot consumano un’immensa potenza di calcolo, che a sua volta
richiede elettricità, acqua per il raffreddamento dei server, terreni per i data
center e miliardi di dollari di investimenti in hardware. In secondo luogo, man
mano che i modelli diventano più sofisticati, anche i costi di gestione
aumentano. In questo senso, si avvicinano alle tecnologie di cloud computing
come Amazon Web Services.
Nel 2023, la società di ricerca SemiAnalysis ha stimato che ChatGPT costasse già
circa 700.000 dollari al giorno per essere gestito. Da allora, i modelli sono
diventati ancora più complessi e dispendiosi in termini di risorse. All’inizio
del 2026, con un numero di utenti attivi settimanali compreso tra ottocento e
novecento milioni e solo trentacinque milioni di abbonati paganti, il costo per
mantenere l’accesso globale a ChatGPT su questa scala si aggirava intorno ai 17
miliardi di dollari all’anno, ovvero quasi 47 milioni di dollari al giorno.
Andy Wu, professore di economia aziendale ad Harvard, sostiene che la maggior
parte delle persone non si rende conto di quanto sia «assurdamente costosa»
l’intelligenza artificiale. Molti sono consapevoli degli elevati costi fissi, ma
non dei costi variabili di inferenza che si verificano ogni volta che il modello
genera un’immagine. OpenAI prevede di spendere oltre 150 miliardi di dollari
solo per i costi di inferenza entro il 2030. Mentre la stragrande maggioranza
degli utenti continua ad accedere alla piattaforma gratuitamente, la domanda è
come si colmerà il divario tra risorse e ricavi e chi ne sopporterà i costi.
LEGGI ANCHE…
DIGITALE
IL CAPITALE NEL CERVELLO
Redazione Jacobin Italia
IL PROBLEMA DELLA REALIZZAZIONE DELL’IA
Dal 2022 al 2025, il settore ha dovuto affrontare un problema di realizzazione.
Questo termine marxista si riferisce al momento nel circuito del capitale (dal
denaro all’investimento in capacità produttiva e di nuovo al denaro) in cui i
beni vengono convertiti in vendite redditizie. Un problema di realizzazione
emerge quando le imprese possono produrre enormi quantità di beni o servizi, ma
non riescono a trovare acquirenti sufficienti per recuperare i costi.
In altre parole, un problema di realizzazione si verifica quando la capacità
produttiva si espande più rapidamente della domanda. Nei primi anni dell’IA, le
aziende tecnologiche hanno investito somme enormi nell’IA generativa – server
farm, addestramento di modelli, manodopera ingegneristica e così via – ma la
domanda era insufficiente. Alla fine del 2025, Wu affermò che il numero di
persone disposte a pagare 20 dollari al mese per l’IA generativa era inferiore a
quello delle persone disposte a pagare 20 dollari al mese per Netflix. Per
generare domanda per un prodotto con cui i loro datori di lavoro erano
finanziariamente coinvolti, le aziende tecnologiche spingevano i dipendenti a
utilizzare i chatbot indipendentemente dal fatto che tale domanda producesse un
output commisurato.
Ad esempio, Meta e Shopify hanno creato classifiche interne per monitorare e
premiare l’utilizzo dei token. Il Ceo di Nvidia, Jensen Huang, dice che sarebbe
«profondamente allarmato» se un ingegnere non utilizzasse token per un valore di
almeno 250.000 dollari in un anno, e che questo non è diverso da uno dei nostri
progettisti di chip che dice: ‘Indovinate un po’? Userò carta e penna’». Questo,
ovviamente, dopo che Nvidia ha investito 30 miliardi di dollari in OpenAI,
finanziando la domanda per il proprio prodotto.
A gennaio, Accenture ha comunicato ai dirigenti che, per essere presi in
considerazione per le promozioni, avrebbero dovuto utilizzare regolarmente
strumenti di intelligenza artificiale. «Vorrei che ci fosse maggiore trasparenza
sull’applicazione dell’uso dell’IA da parte dei dirigenti – spiega un dipendente
di Accenture a Jacobin – La politica è vaga. Temo che incoraggerà le persone a
usare l’IA solo per raggiungere un obiettivo».
Il problema della realizzazione è stato quindi rimandato attraverso una
combinazione di creazione fittizia della domanda e prezzi sovvenzionati. È stato
ulteriormente oscurato dalla logica di finanziamento circolare del settore, in
cui un piccolo gruppo di imprese si è isolato dalla logica di mercato
finanziandosi, fornendo e vendendosi reciprocamente prodotti in un circuito
chiuso.
Assalto ai fornelli
Acquista l’ultimo numero della rivista
STRATIFICAZIONE DELLE CLASSI DI IA
Alla fine del 2025, Anthropic ha rilasciato il suo modello Claude Opus 4.5, un
modello di intelligenza artificiale agentiva destinato ai «lavoratori della
conoscenza». Opus 4.5 rappresenta un vero e proprio traguardo tecnologico sotto
ogni punto di vista convenzionale. Il modello è anche notevolmente più costoso
da gestire e ha portato sia a un cambiamento nella strategia di prezzo sia a una
rottura con la precedente retorica dell’IA come utilità universale.
I token sono l’unità di dati di base elaborata dai modelli di intelligenza
artificiale. Chiacchierare con un chatbot utilizza diverse centinaia di token
per paragrafo. Le attività di intelligenza artificiale agentiva, in cui i
modelli navigano autonomamente sul web, scrivono ed eseguono codice o gestiscono
flussi di lavoro complessi, possono rapidamente consumare milioni di token .
Secondo l’imprenditore e investitore della Silicon Valley Vasudev Bhandarkar, il
motivo principale per cui l’intelligenza artificiale agentiva è esponenzialmente
più costosa risiede nella sua molteplicità (la capacità di gestire molte
chiamate contemporaneamente), nella quantità di contesto che può trasportare,
nella sua capacità di verifica, nell’utilizzo di strumenti esterni e
nell’elevato costo in caso di errore. Il passaggio dall’intelligenza artificiale
conversazionale a quella agentiva rappresenta un enorme salto in termini di
intensità di risorse.
Dall’inizio del 2026, Anthropic ha progressivamente introdotto supplementi
basati su token, livelli di inferenza premium, fatturazione separata per gli
agenti autonomi e misurazione basata su crediti per l’utilizzo degli strumenti e
le integrazioni. All’inizio di maggio, l’azienda ha annunciato che gli abbonati
a Claude avrebbero dovuto affrontare un contatore di crediti mensile separato
per gli strumenti degli agenti e gli strumenti di terze parti (strumenti che
incapsulano il modello Claude) fatturati alle tariffe complete dell’interfaccia
di programmazione delle applicazioni (Api) a partire da metà giugno. Contattato
per un commento, un ricercatore anonimo specializzato in modelli linguistici di
grandi dimensioni (Llm) ha dichiarato a Jacobin :
A partire da Claude Opus 4.5, i fornitori di modelli stanno dando sempre più
priorità alle capacità agentive e agli accordi business-to-business (B2B), a
scapito dei consumatori finali. Aziende come Google e OpenAI, pur rimanendo
interessate all’adozione di massa, stanno cambiando strategia. Anthropic,
invece, ha privilegiato il B2B fin dall’inizio.
La direzione è chiara: le forme di intelligenza artificiale più potenti e che
richiedono un’elevata potenza di calcolo sono la priorità e saranno sempre più
razionate ai lavoratori qualificati delle grandi aziende, i cui datori di lavoro
possono permettersele. All’inizio di marzo, Claude ha brevemente superato
ChatGPT per numero di utenti attivi giornalieri, registrando un aumento del
1.487% nell’utilizzo. La domanda c’è. Il modello di prezzo per sostenerla a
livelli di accesso democratici e accessibili non esiste. Per dirla con le parole
di Bhandarkar: «La domanda è: l’intelligenza artificiale diventerà come
l’elettricità o i jet privati?».
LEGGI ANCHE…
DIGITALE
I SISTEMI GPT SONO MACCHINE IDEOLOGICHE
Leif Weatherby
LA TRANSIZIONE CHE NESSUNO HA VOTATO
Oppure, al momento, la risposta del settore a questa contraddizione è che l’IA
si ripagherà da sola grazie ai guadagni in «produttività». L’esperienza recente
di Uber suggerisce che la questione potrebbe non essere così semplice. Dopo aver
speso 3,4 miliardi di dollari in IA nel 2025, Uber ha esercitato una forte
pressione interna sui suoi cinquemila ingegneri affinché adottassero Claude, con
classifiche che incentivavano il massimo utilizzo. L’azienda ha esaurito
l’intero budget per l’IA previsto per il 2026 entro aprile. Il direttore
tecnologico di Uber ha ammesso di essere «tornato al punto di partenza perché il
budget che pensavo mi sarebbe servito è già stato ampiamente superato».
Il valore d’uso dell’IA e i suoi costi per il capitale hanno avuto una
divergenza. I guadagni di produttività sono probabilmente reali, ma
insufficienti. Ad esempio, il consumo per sviluppatore presso Uber è aumentato
da cinque a venti volte, ma nessun parametro di riferimento pubblico mostra un
aumento corrispondente del «valore di output». Secondo il ricercatore della Llm,
«che tu sia un fornitore di modelli o un’azienda tecnologica nell’economia
dell’IA, la concorrenza è agguerrita e si avverte la pressione di mantenere alti
i costi, anche se si investe più di quanto si dovrebbe o si può». Per ora, non
ci sono prove che i conti tornino e, soprattutto, non ci sono prove che debbano
farlo. Lo stesso sistema di finanziamento circolare consente al settore di
continuare a spendere senza conciliare costi e rendimenti.
Anche se l’intelligenza artificiale alla fine si ripagasse da sola in un’azienda
come Uber, cosa significherebbe per la maggior parte dei lavoratori esclusi da
questi vantaggi? In altre parole, anche se l’IA fosse produttiva nel complesso,
per chi si concretizzerebbe questo valore in termini di produttività? I guadagni
in termini di efficienza riguardano principalmente il lavoro intellettuale, ma i
costi – prezzi più elevati, accesso razionato, precarietà del lavoro e,
soprattutto, devastazione ambientale – sono ripartiti in modo ineguale.
Sebbene le aziende che hanno imposto il consumo di IA non abbiano un piano
chiaro per finanziare l’aumento dei costi, hanno dimostrato una notevole
capacità di assicurarsi finanziamenti innovativi e di rimandare il momento del
giudizio attraverso i mercati dei capitali. La preoccupazione principale non
riguarda i bilanci dell’economia dell’IA, ma il fatto che si sia disposti ad
accettare passivamente questo compromesso. È possibile rinegoziare i termini di
questa transizione?
*Sophie Bandarkar è una scrittrice, organizzatrice e dottoranda in economia.
Vive a Parigi. Questo articolo è uscito su JacobinMag. La traduzione è a cura
della redazione.
DIAMOCI UN TAGLIO
La rivoluzione non si fa a parole.
Serve la partecipazione collettiva.
Anche la tua.
Abbonati
a Jacobin Italia
L'articolo L’era dell’IA a basso costo è già finita proviene da Jacobin Italia.