Il costo dell’intelligenza artificiale: crescita esponenziale della computazione e concentrazione industriale

· La computazione necessaria per addestrare l’AI è cresciuta esponenzialmente negli ultimi vent’anni globalmente.
· Modelli linguistici e multimodali dominano consumi computazionali, superando nettamente altri domini dell’intelligenza artificiale.
· Poche aziende tecnologiche controllano infrastrutture necessarie per sviluppare sistemi AI sempre più avanzati.

L’insieme di dati sulla computazione utilizzata per addestrare i principali sistemi di intelligenza artificiale rappresenta una delle migliori fotografie disponibili dell’evoluzione tecnologica dell’AI negli ultimi decenni. La computazione è misurata in petaFLOP (10¹⁵ operazioni in virgola mobile) e consente di valutare quanto “lavoro computazionale” sia stato necessario per addestrare ciascun modello. Sebbene le stime presentino un certo grado di incertezza – soprattutto per i modelli più recenti e proprietari come GPT-4, GPT-5 o Grok – il dataset mostra con grande chiarezza una tendenza fondamentale: la crescita della potenza di calcolo impiegata nell’AI è stata straordinariamente rapida e costituisce uno dei principali motori del progresso del settore.

Il dataset comprende 524 sistemi AI sviluppati tra il 1950 e il 2026 e copre diversi domini applicativi: linguaggio, visione artificiale, biologia computazionale, generazione di immagini, robotica, giochi, riconoscimento vocale e modelli generalisti. La distribuzione dei sistemi mostra il predominio del dominio linguistico, con 243 modelli, seguito dalla visione artificiale con 99 sistemi e dai modelli multi-dominio con 56 osservazioni. Questo riflette il crescente interesse dell’industria e della ricerca verso i grandi modelli linguistici e i sistemi generali capaci di svolgere molteplici compiti.

Uno degli aspetti più impressionanti è la crescita esponenziale della computazione nel tempo. Nei decenni iniziali dell’intelligenza artificiale, dagli anni Cinquanta agli anni Ottanta, i sistemi richiedevano quantità di calcolo estremamente ridotte rispetto agli standard attuali. Modelli pionieristici come ADALINE o altre prime reti neurali operavano con risorse che oggi apparirebbero insignificanti. La limitata disponibilità di hardware rappresentava uno dei principali vincoli allo sviluppo dell’AI.

Con l’avvento delle GPU e del deep learning a partire dagli anni Duemila, la situazione cambia radicalmente. Modelli di computer vision come AlexNet, ResNet e le successive architetture profonde iniziano a richiedere quantità di computazione sempre maggiori. Tuttavia, la vera accelerazione avviene dopo il 2017, anno della pubblicazione dell’architettura Transformer, che ha reso possibile l’addestramento efficiente di modelli linguistici di dimensioni enormi.

I dati evidenziano infatti come il dominio del linguaggio naturale sia diventato il principale consumatore di potenza computazionale. La mediana della computazione utilizzata dai modelli linguistici supera ampiamente quella della maggior parte degli altri domini, mentre i valori massimi raggiungono livelli enormemente superiori. I moderni Large Language Models richiedono infatti decine di miliardi di petaFLOP per l’addestramento, una quantità di risorse che solo poche organizzazioni nel mondo possono permettersi.

Particolarmente interessante è il confronto tra domini. I modelli di visione artificiale presentano una computazione massima di circa 193 milioni di petaFLOP, mentre quelli biologici arrivano a oltre un miliardo di petaFLOP. I sistemi di generazione di immagini superano i 500 milioni di petaFLOP. Tuttavia, queste cifre risultano modeste se confrontate con i modelli multi-dominio e linguistici di ultima generazione.

I modelli multi-dominio rappresentano infatti la categoria più esigente in termini di risorse computazionali. Secondo il dataset, il massimo raggiunge circa 500 miliardi di petaFLOP, un valore straordinario che supera di oltre un ordine di grandezza quello dei più grandi modelli linguistici specializzati. Questo dato riflette la crescente ambizione dell’industria AI: non più sistemi progettati per un singolo compito, ma modelli capaci di comprendere testo, immagini, codice, audio e altre forme di informazione all’interno di un’unica architettura.

Osservando i modelli più recenti emergono alcuni protagonisti della nuova corsa alla scala computazionale. Tra i sistemi che richiedono più potenza di calcolo figurano Grok 4, GPT-4.5, Grok 3, GPT-5, Llama 4 Behemoth, Gemini 1.0 Ultra, Claude 3.7 Sonnet e altri modelli sviluppati dalle principali aziende del settore.

Le aziende coinvolte in questa competizione sono soprattutto OpenAI, Google, Anthropic, Meta e xAI. Queste organizzazioni dispongono di infrastrutture computazionali gigantesche, spesso costituite da decine o centinaia di migliaia di GPU collegate tra loro in enormi data center.

La crescita della computazione non è soltanto un fenomeno tecnico, ma anche economico. Addestrare un modello all’avanguardia può costare centinaia di milioni di dollari tra hardware, energia elettrica, personale specializzato e manutenzione dell’infrastruttura. Ciò contribuisce a creare una crescente concentrazione del potere tecnologico nelle mani di poche organizzazioni che possiedono le risorse necessarie per sostenere tali investimenti.

Un’altra implicazione riguarda il consumo energetico. L’aumento della computazione si traduce inevitabilmente in un aumento della domanda di energia elettrica. Sebbene i moderni chip siano più efficienti rispetto al passato, la crescita delle dimensioni dei modelli è stata così rapida da compensare ampiamente i guadagni di efficienza. Di conseguenza, la sostenibilità ambientale dell’AI è diventata un tema centrale nel dibattito pubblico e accademico.

I dati suggeriscono inoltre che la ricerca sull’intelligenza artificiale stia seguendo una strategia basata sulla scala. Negli ultimi anni, numerosi studi hanno mostrato che l’aumento simultaneo di parametri, dati e computazione tende a migliorare le prestazioni dei modelli in modo relativamente prevedibile. Questo fenomeno, noto come “scaling laws”, ha incoraggiato aziende e laboratori di ricerca a investire quantità sempre maggiori di risorse computazionali.

Tuttavia, la crescita esponenziale della computazione potrebbe incontrare limiti economici e fisici. Il costo dei data center, la disponibilità di energia e la produzione di semiconduttori avanzati rappresentano fattori che potrebbero rallentare l’espansione futura. Inoltre, alcuni ricercatori ritengono che i miglioramenti ottenuti aumentando semplicemente la scala possano progressivamente diminuire, rendendo necessarie nuove innovazioni algoritmiche.

Dal punto di vista storico, il dataset mostra una trasformazione radicale dell’intelligenza artificiale. Nei primi decenni l’innovazione derivava principalmente da nuove idee teoriche e algoritmi. Oggi, pur continuando a essere importanti, gli avanzamenti dipendono in misura crescente dalla disponibilità di enormi risorse computazionali. In altre parole, il progresso dell’AI è diventato sempre più strettamente legato all’industria dell’hardware e alle infrastrutture digitali globali.

Un ulteriore elemento interessante è la differenza tra ricerca accademica e ricerca industriale. Molti dei modelli più grandi presenti nel dataset sono stati sviluppati da aziende private e spesso le informazioni relative alla computazione utilizzata sono stime indirette. Questo riflette una crescente opacità del settore, dove i dettagli tecnici vengono frequentemente considerati vantaggi competitivi e non vengono divulgati integralmente.

In conclusione, questi dati raccontano la storia di una crescita senza precedenti della potenza computazionale impiegata nell’intelligenza artificiale. Dai modelli pionieristici del secolo scorso ai giganteschi sistemi multimodali contemporanei, la quantità di calcolo necessaria per addestrare l’AI è aumentata di molti ordini di grandezza. Il dominio linguistico e i modelli generalisti guidano questa evoluzione, mentre aziende come OpenAI, Google, Anthropic, Meta e xAI competono per costruire sistemi sempre più potenti. La computazione è ormai diventata una delle risorse strategiche fondamentali dell’economia digitale e rappresenta uno degli indicatori più significativi per comprendere la direzione futura dell’intelligenza artificiale.

Fonte: Our World in Data

Link: https://ourworldindata.org/

Termine	Definizione
Addestramento (Training)	Processo attraverso il quale un modello di intelligenza artificiale apprende analizzando grandi quantità di dati e ottimizzando i propri parametri.
Algoritmo	Sequenza di istruzioni matematiche e logiche utilizzata per risolvere un problema o svolgere un compito specifico.
Architettura Transformer	Architettura introdotta nel 2017 che costituisce la base dei moderni modelli linguistici e multimodali.
Computazione	Quantità totale di operazioni matematiche eseguite durante l'addestramento o l'utilizzo di un modello AI.
Data Center	Infrastruttura che ospita server e processori utilizzati per l'elaborazione dei dati e l'addestramento dell'AI.
Deep Learning	Tecnica di apprendimento automatico basata su reti neurali profonde capaci di apprendere schemi complessi dai dati.
FLOP (Floating Point Operation)	Singola operazione matematica effettuata su numeri decimali; unità base della potenza di calcolo.
Generative AI (AI Generativa)	Sistemi capaci di creare nuovi contenuti come testi, immagini, video, musica o codice.
GPU (Graphics Processing Unit)	Processore specializzato nel calcolo parallelo, fondamentale per l'addestramento dei moderni modelli AI.
Large Language Model (LLM)	Grande modello linguistico addestrato su enormi quantità di testo per comprendere e generare linguaggio naturale.
Machine Learning	Ramo dell'intelligenza artificiale che permette ai sistemi di apprendere dai dati senza programmazione esplicita.
Modello Multimodale	Sistema AI in grado di elaborare contemporaneamente testo, immagini, audio, video e altri tipi di dati.
Parametro	Valore numerico interno di un modello che viene ottimizzato durante l'addestramento.
PetaFLOP	Unità di misura pari a 10¹⁵ operazioni in virgola mobile (1.000.000.000.000.000 operazioni).
PetaFLOP Totale (Total Training Compute)	Quantità complessiva di calcolo utilizzata per addestrare un modello di intelligenza artificiale.
Rete Neurale	Sistema matematico ispirato al cervello umano composto da nodi interconnessi che elaborano informazioni.
Scaling Laws	Relazioni empiriche che descrivono il miglioramento delle prestazioni dei modelli all'aumentare di dati, parametri e computazione.
Supercomputer	Sistema informatico ad altissime prestazioni capace di eseguire enormi quantità di calcoli in tempi ridotti.
Visione Artificiale (Computer Vision)	Settore dell'AI dedicato all'analisi e all'interpretazione automatica di immagini e video.
Modello Fondazionale (Foundation Model)	Grande modello generalista addestrato su vasti dataset e adattabile a numerosi compiti differenti.

Angelo Leogrande

Cerca nel blog

Il costo dell’intelligenza artificiale: crescita esponenziale della computazione e concentrazione industriale

Commenti

Posta un commento

Post popolari in questo blog

Nord e Sud a confronto: differenze territoriali nei tassi di adeguata alimentazione

La Lombardia resta in testa: oltre il 30% di giudizi positivi per gran parte del decennio

Il Veneto guida la crescita: +426% di donne nella politica locale in dieci anni