Quando l’AI raggiunge l’esperto: 1.320 compiti professionali alla prova
L’AI raggiunge livelli umani in 1.320 compiti professionali. Ma tra test e realtà c’è un abisso. Dati, professioni a rischio e futuro del lavoro.
Lo studio GDPval di OpenAI ha messo nero su bianco quello che molti sospettavano: i sistemi di intelligenza artificiale oggi disponibili riescono a eguagliare — e in certi casi superare — il lavoro di professionisti esperti. Non parliamo di simulazioni accademiche o di giochini da laboratorio. Parliamo di 1.320 compiti reali, estratti da 44 professioni diverse, valutati da chi quei mestieri li fa da almeno 14 anni.
Claude Opus 4.1 di Anthropic ha raggiunto la parità con gli umani nel 49% dei casi. GPT-5 si è fermato poco sotto. Cento volte più veloce, cento volte più economico. I numeri sono questi, e vanno presi sul serio.
Ma qui viene il bello: se l’AI sa fare tutto questo, perché non vediamo ancora orde di disoccupati per strada?
I test dicono una cosa, la realtà ne racconta un’altra
GDPval ha chiesto alle macchine di produrre documenti, presentazioni, analisi finanziarie, piani di cura infermieristici. Roba vera, insomma. Gli esperti hanno confrontato il lavoro umano con quello delle AI e hanno votato. Il risultato? Le macchine se la cavano. Anzi, in molti casi fanno un lavoro “abbastanza buono” da essere indistinguibile da quello di un professionista rodato.
Eppure, c’è un dettaglio non da poco che OpenAI stessa ammette a chiare lettere: questi test non tengono conto della supervisione umana, delle iterazioni, del processo di integrazione nel flusso di lavoro reale. In altre parole, l’AI produce un output di qualità quando le dai il compito giusto, nel formato giusto, con le informazioni giuste. Ma quante volte il lavoro vero funziona così?
Prendiamo un cassiere di supermercato. Secondo lo studio, l’AI batte gli umani nell’81% dei casi in compiti legati a quel ruolo. Sembra un disastro. Eppure, i cassieri non sono ancora estinti. Perché? Perché gestire un cliente che non trova il codice a barre, calmare un anziano che non capisce la cassa automatica, o intercettare un furto in atto non rientra esattamente nelle 1.320 task testate da GDPval.
Le professioni più vulnerabili (e quelle che resistono)
Lo studio ha identificato chi rischia di più. Addetti al banco vendita e cassieri: 81% di compiti automatizzabili. Manager delle vendite e addetti alle spedizioni: 80%. Software developer: 70%. Editor: 75%. Investigatori privati: 70%.
Ma c’è anche chi tiene botta. I registi cinematografici, i giornalisti e i produttori perdono contro l’AI solo in un terzo dei test. Non è una vittoria schiacciante, ma nemmeno una disfatta. Forse perché la macchina sa scrivere un articolo corretto, ma fatica a fiutare la storia che nessuno ha ancora raccontato. O a capire quale dettaglio in una scena vale più di mille effetti speciali.
Vale la pena ricordare: l’AI testata da GDPval non sta ancora lavorando in redazione, in cantiere o in sala operatoria. Sta producendo output in condizioni controllate. Quella della sostituzione di massa è ancora più una narrazione che un dato di fatto.
I numeri della paura (e qualche dato concreto)
Secondo il World Economic Forum, il 40% delle aziende prevede di ridurre il personale dove l’AI può automatizzare. Suona come un annuncio apocalittico. Ma andiamo a vedere nel dettaglio: nel 2025 sono stati eliminati circa 77.999 posti di lavoro nel settore tech direttamente collegati all’automazione tramite AI. Un numero importante, certo. Ma per mettere le cose in proporzione: gli Stati Uniti contano oltre 160 milioni di lavoratori. Stiamo parlando dello 0,05% della forza lavoro.
Il Bureau of Labor Statistics americano ha iniziato a incorporare l’AI nelle sue proiezioni sull’occupazione. E cosa ha scoperto? Che l’impatto finora è concentrato, non diffuso. I giovani tra i 20 e i 30 anni nei settori tech hanno visto la disoccupazione salire di 3 punti percentuali dall’inizio del 2025. Male, senza dubbio. Ma non è ancora il collasso generale che certe previsioni annunciavano.
Goldman Sachs stima che, se l’AI venisse adottata su larga scala con gli attuali casi d’uso, il 2,5% dell’occupazione americana sarebbe a rischio di sostituzione. Non il 50%. Non il 30%. Il 2,5%. Certo, se l’AI migliora ancora, quella percentuale può salire. Ma siamo ben lontani dall’estinzione di massa del lavoro umano.
Il gap tra benchmark e ufficio
Facciamo un esperimento mentale. Immaginiamo che domani tutti i software developer vengano sostituiti da AI. Chi gestisce i bug che l’AI non vede? Chi spiega al cliente perché quella funzione che vuole non ha senso? Chi discute con il team di design perché l’interfaccia che hanno disegnato è tecnicamente impossibile da implementare?
Le AI di oggi producono codice, certo. Ma non partecipano alle riunioni. Non negoziano le deadline. Non decidono quale feature togliere per rispettare il budget. GDPval misura la capacità di eseguire task isolati. Il lavoro vero è fatto di contesto, relazioni, compromessi. Tutte cose che un modello linguistico, per quanto avanzato, ancora non sa maneggiare.
Questo non significa che l’AI non avrà mai un impatto massiccio. Significa che quell’impatto non è automatico. Richiede che le aziende ripensino i processi, che investano in integrazione, che formino le persone. E tutto questo richiede tempo, risorse, voglia di cambiare. Tre cose che nelle organizzazioni reali non abbondano.
Quello che le macchine sanno fare davvero
Allora, a che serve tutta questa potenza di calcolo se non sostituisce i lavoratori? Beh, chi ha detto che l’unico scopo dell’AI è rimpiazzare gli umani?
Oggi l’intelligenza artificiale è un assistente formidabile. Può scrivere la prima bozza di un documento, analizzare migliaia di dati in pochi secondi, generare opzioni tra cui scegliere. Ma resta un assistente. Uno molto bravo, velocissimo, instancabile. Ma che ha bisogno di qualcuno che gli dica cosa fare, che controlli il risultato, che decida se quel risultato ha senso nel mondo reale.
La differenza tra “l’AI può fare questo” e “l’AI sta facendo questo al posto degli umani” è colossale. I benchmark misurano la prima cosa. La seconda dipende da decine di fattori che non c’entrano nulla con la tecnologia: economici, organizzativi, culturali, legali.
Un esempio: i robo-advisor per la gestione finanziaria esistono da anni. Sono efficienti, precisi, economici. Eppure i consulenti finanziari umani non sono scomparsi. Perché? Perché chi ha un patrimonio complesso vuole parlare con una persona. Vuole spiegare le sue paure, i suoi progetti, i suoi vincoli familiari. E vuole che qualcuno gli dica: “Fidati, so cosa sto facendo”. L’AI sa fare i calcoli. Non sa rassicurare.
Cosa ci aspetta davvero
Guardiamo i dati senza catastrofismi. Sì, l’AI sta migliorando a una velocità impressionante. Le prestazioni di GPT-5 sono più che raddoppiate rispetto a GPT-4o in appena 15 mesi. Se questo ritmo continua, nel giro di pochi anni potremmo avere macchine che superano stabilmente gli umani in molti compiti professionali.
Ma “potere superare” non significa “sostituire”. Il lavoro non è solo output. È negoziazione, improvvisazione, empatia, responsabilità. Quando un medico comunica una diagnosi grave, non sta solo trasferendo informazioni. Quando un avvocato costruisce una difesa, non sta solo citando norme. Quando un insegnante spiega un concetto, non sta solo ripetendo nozioni.
L’AI potrà diventare sempre più brava a produrre contenuti, analisi, codice. Ma il valore del lavoro umano si sta già spostando altrove. Verso il giudizio, la supervisione, la creatività applicata, la relazione. Verso tutte quelle cose che non entrano in un benchmark.
Le domande che contano
Alla fine, i numeri di GDPval raccontano una storia interessante ma incompleta. Ci dicono che la tecnologia è pronta. Non ci dicono se le aziende lo sono. Non ci dicono se i lavoratori lo sono. E soprattutto non ci dicono se vogliamo davvero un mondo dove ogni documento, ogni analisi, ogni decisione passa per un algoritmo.
Forse la domanda giusta non è “quando l’AI sostituirà il mio lavoro?” ma “come cambierà il mio lavoro con l’AI?”. E la risposta, per ora, sembra essere: parecchio, ma non nel modo che pensavamo.
Domande frequenti
L’intelligenza artificiale sostituirà davvero i lavoratori umani?
L’AI sta già sostituendo alcuni ruoli, principalmente quelli con compiti ripetitivi e standardizzati. Tuttavia, i dati mostrano che l’impatto reale è ancora limitato rispetto alle previsioni catastrofiche. Nel 2025, circa 78.000 posizioni sono state eliminate per via dell’automazione nei settori tech, su una forza lavoro di oltre 160 milioni di persone negli USA. La sostituzione non è automatica: richiede investimenti, riprogettazione dei processi e formazione.
Quali sono le professioni più a rischio di automazione?
Secondo lo studio GDPval, le professioni più vulnerabili includono cassieri e addetti al banco (81% di compiti automatizzabili), manager delle vendite (80%), software developer (70%), editor (75%) e investigatori privati (70%). Tuttavia, questi dati misurano la capacità tecnica dell’AI di eseguire compiti specifici, non la probabilità effettiva di sostituzione completa del ruolo.
Fonti e approfondimenti
- OpenAI: Measuring the performance of our models on real-world tasks (2025)
- Fortune: OpenAI study suggests AI may be about to eclipse human expertise in real-world tasks (2025)
- Goldman Sachs Research: How Will AI Affect the Global Workforce? (2025)
- World Economic Forum: Future of Jobs Report 2025 (2025)
- McKinsey & Company: AI in the workplace: A report for 2025 (2025)
- Yale Budget Lab: Evaluating the Impact of AI on the Labor Market: Current State of Affairs (2025)
- SSRN: AI Job Displacement Analysis (2025-2030) (2025)
