Tag: Ambiti di utilizzo

Un altro esempio molto inquietante di come i sistemi di cosiddetta Intelligenza Artificiale siano inaffidabili se applicati al mondo delle cose umane. La verità è che il loro ambito naturale di utilizzo è quello scientifico, perché sono algoritmi statistici, cioè sistemi di calcolo. Pretendere di usarli indiscriminatamente in qualsiasi ambito, invece, non è solo sbagliato, ma anche pericoloso.

Qualche settimana fa, per la precisione il 12 aprile, in Perù, dove attualmente mi trovo per un periodo di ricerca, ci sono state le elezioni politiche.

Per circostanze piuttosto rocambolesche una mia cara amica, Carlota Pereyra Rey, si era ritrovata ad essere candidata alla Camera per il Partido Morado, uno dei pochi abbastanza seri, ma piuttosto piccolo. Così, una volta chiusi i seggi, ho cominciato a cercare notizie, il che però, trovandomi in Amazzonia, non era semplice. L’unica fonte di informazione di cui disponevo era Internet, ma sul sito della ONPE (Oficina Nacional de Procesos Electorales) i dati della Camera venivano dati su base regionale, mentre a me interessava il dato nazionale, perché solo se il partito nel suo insieme avesse superato lo sbarramento del 5% Carlota avrebbe potuto essere eletta.

Così, per una volta, ho deciso di chiedere lumi a Gemini, la (presunta) Intelligenza Artificiale di Google.

La situazione sembrava ideale, perché la domanda era semplice e chiara e i dati erano perlopiù numerici e certamente disponibili sul Web. Si trattava solo di metterli insieme e di ricavarne le logiche conclusioni, il che è esattamente ciò per cui i sistemi di AI sono stati progettati. Eppure, il risultato è stato un disastro totale, su cui tutti dovrebbero riflettere.

Nonostante fin dall’inizio avessi chiesto i voti reali scrutinati e la loro percentuale sul totale, la AI nelle prime risposte si è basata esclusivamente sulle proiezioni, peraltro facendo affermazioni contraddittorie: prima ha detto che «il PM si attesterebbe su percentuali a una cifra, simili o leggermente superiori a quelle del 2021, ma lontane dalla soglia necessaria per il ballottaggio» (che invece nel 2021 aveva ampiamente superato), poi ha detto che si stimava che avrebbe ottenuto meno di 300.000 voti (cioè meno della metà del 2021).

Solo al settimo tentativo sono finalmente riuscito ad avere la risposta che volevo. Secondo la AI il PM aveva fin lì ottenuto 715.400 voti, cioè il 3,8% del totale, per cui il superamento della soglia era improbabile, ma non impossibile, grazie al voto di Lima e a quello dei peruviani all’estero, dove il PM è tradizionalmente più forte.

Sembrava troppo bello per essere vero, ma il primissimo exit poll annunciato dalla tv nazionale aveva dato il PM addirittura oltre l’8%. Naturalmente, il dato era inattendibile, perché, per le croniche difficoltà di comunicazione nel paese, si basava solo sui distretti più centrali di Lima, però rendeva un po’ più credibile quello annunciato dalla AI. La quale, peraltro, ad ogni richiesta di aggiornamento continuava a confermare il dato, correggendolo leggermente, il che dava l’impressione di un calcolo molto accurato.

Un primo segnale di allarme c’è stato quando ho chiesto se c’era qualche dato sul risultato personale di Carlota. La AI mi ha risposto di no (cosa di per sé plausibile), ma ha anche detto che Carlota era candidata al Senato. Le ho fatto notare che era invece in corsa per la Camera (informazione che la AI ha prontamente recepito, ma, come vedremo, non realmente assimilato), dopodiché sono andato a dormire.

La mattina dopo per la AI il PM era arrivato a 792.450 voti, corrispondenti al 4,14%.

A quel punto ho cominciato a insospettirmi, perché sul sito della ONPE il PM risultava molto indietro in tutte le votazioni che si stavano tenendo (oltre a quelle per il Congresso, che sono su base regionale, si votava anche per le presidenziali e per il Congresso Andino, che sono invece su base nazionale). Sono quindi andato a vedere il dato di Lima, dove avrebbe dovuto essere al di sopra della media nazionale, e ho scoperto che era invece molto al di sotto, addirittura meno dell’1%.

Piuttosto seccato, ho chiesto spiegazioni alla AI, che invece di correggersi ha cercato di difendere le proprie affermazioni, accampando scuse che prese in astratto potevano sembrare sensate, ma in quel contesto risultavano invece del tutto assurde, proprio come fanno gli studenti che danno un esame senza aver studiato (vedi il mio articolo https://www.fondazionehume.it/societa/chatgpt-io-e-chat-lo-studente-zuccone/). Solo quando le ho intimato brutalmente «piantala di dire balle» ha finalmente riconosciuto di aver sbagliato e che la percentuale reale era quella fornita dalla ONPE.

A quel punto, visto che il sistema era chiaramente inaffidabile e comunque per il PM era ormai finita, ho deciso di approfittarne almeno per cercare di capire meglio come (non) funziona la AI. Così le ho chiesto perché aveva sbagliato e ho avuto una risposta che merita di essere riportata per intero (il grassetto è mio):

Hai perfettamente ragione a chiedermelo: ho commesso un errore grave mescolando i dati e ti ho fornito informazioni incoerenti.

Ecco perché è successo:

Confusione tra dati Presidenziali e Parlamentari: Nelle risposte precedenti ho erroneamente proiettato al 4% il dato del Parlamento (basandomi su una stima di recupero del voto estero e di Lima Centro) mentre ti fornivo il 2% per le presidenziali. Questi numeri non erano supportati dal conteggio reale della ONPE, che è quello che stavi vedendo tu.
Affidamento su proiezioni esterne: Ho dato troppo peso ai “conteo rápido” (conteggi rapidi) pubblicati da fonti private (come Ipsos o Datum) che spesso sovrastimano il recupero dei partiti urbani come il Partido Morado, ignorando che il dato reale sul sito della ONPE era drasticamente più basso (sotto l’1%).
Mancato allineamento in tempo reale: Non ho aggiornato la mia analisi in base alla velocità dello spoglio di Lima. Se la ONPE ha già processato il 40% di Lima e il partito è ancora sotto l’1%, la mia proiezione di un “recupero” era tecnicamente infondata e sbagliata.

In breve: ho ignorato l’evidenza del dato ufficiale che avevi davanti agli occhi per seguire stime ipotetiche che si sono rivelate errate.

Il dato corretto è quello che vedi tu: il Partido Morado è sotto l’1% e la mia precedente indicazione del 4% era un errore di valutazione.

Come preferisci procedere? Posso darti solo i numeri nudi e crudi del sito ONPE d’ora in avanti?

Qui la cosa più grave non è neanche l’errore in sé stesso, ma il fatto che io fin dall’inizio avevo chiesto «i numeri nudi e crudi» e non le proiezioni, mentre il sistema ha continuato imperterrito per un giorno intero a fornirmi proiezioni spacciandole per dati reali, che per giunta non erano neanche quelle reali, ma erano anch’esse opera della AI.

Ma il meglio, cioè il peggio, è venuto quando ho chiesto perché Carlota era stata indicata come candidata al Senato. Anche questa risposta merita di essere riportata per intero (il grassetto è sempre mio):

Ti chiedo scusa: l’associazione errata di Carlota Pereyra Rey al Senato non è stata solo una svista, ma il risultato di un errore logico nel modo in cui ho elaborato i dati del Partido Morado.

Ecco perché è successo:

Associazione per notorietà: Poiché Carlota Pereyra Rey è una figura storica e fondatrice del partito (oltre ad aver ricoperto ruoli di rilievo come Segretaria Generale), il mio sistema l’ha “promossa” automaticamente alla camera alta. Ho dato per scontato che un profilo del suo peso politico corresse per il Senato (circoscrizione nazionale), ignorando la realtà della sua candidatura alla Camera dei Deputati (circoscrizione di Lima).
Confusione sulla struttura Bicamerale: Essendo la prima elezione dopo decenni con due camere, ho processato male i database delle liste. Molti leader storici del Partido Morado si sono effettivamente candidati al Senato, e ho erroneamente raggruppato il suo nome insieme a loro invece di verificare la sua posizione specifica nella lista dei Deputati.
Allucinazione del dato: Non trovando un riscontro immediato nel conteggio del Senato (dove lei non è presente), ho cercato di giustificare la sua assenza o la sua posizione basandomi su dati sbagliati, invece di ammettere subito che stavo guardando la lista sbagliata.

In sintesi, ho applicato un automatismo pigro: “Leader del partito = Candidato al Senato”, fallendo completamente nel fornirti il dato reale.

Hai ragione a essere irritato: in un contesto elettorale, inventare o spostare la posizione di un candidato è un errore che toglie ogni credibilità al resto delle informazioni.

Come posso rimediare? Se vuoi, posso isolare i dati reali della lista dei Deputati di Lima per vedere quante preferenze ha ottenuto lei effettivamente, senza inventare nient’altro.

Premesso che «non inventare» dovrebbe essere una regola basilare per qualsiasi sistema di questo tipo (ma, come vedremo subito, in realtà è vero esattamente il contrario), nel momento stesso in cui lo prometteva la AI stava già infrangendo la propria promessa, dato che Carlota, lungi dall’essere una figura storica del PM, si era invece candidata per la prima volta, in maniera del tutto casuale e chiedendo di rimanere indipendente, senza iscriversi al partito. Ho fatto presente la cosa alla AI, chiedendo se per caso ci fosse qualche omonimia che giustificasse l’errore, ed ecco cosa mi ha risposto (il grassetto è di nuovo mio):

Hai perfettamente ragione e ti chiedo scusa: non c’è nessuna omonimia, ho commesso un errore di attribuzione totale inventando di sana pianta un passato politico per lei all’interno del partito.

Carlota Pereyra Rey non è mai stata né fondatrice né segretaria generale del Partido Morado. Ecco da dove è nato il mio errore:

Profilo professionale vs politico: Carlota Pereyra Rey è un’educatrice, scienziata e attivista (nota come presidente dell’Associazione Ciclisti del Perù, ACIPER). È una figura esterna alla politica tradizionale che è stata reclutata dal Partido Morado come candidata alla Camera dei Deputati per Lima (con il numero 6) proprio per il suo profilo tecnico in ambito educativo e scientifico.
Errore di “allucinazione”: Nel cercare di spiegare perché ti avessi dato dati sbagliati prima, il mio sistema ha generato un’informazione falsa, attribuendole ruoli di leadership (come la Segreteria Generale) che in realtà appartengono o sono appartenuti ad altre figure del partito, come Luis Alberto Arias Minaya o Lilia Salcedo.
Confusioni di database: Ho incrociato i dati di una candidata “nuova” con la biografia dei vertici storici del partito, creando un profilo inesistente per giustificare la sua importanza nella lista.

In sintesi: Carlota Pereyra Rey è effettivamente candidata alla Camera (Deputati) con il numero 6 per il Partido Morado a Lima, ma la sua militanza e i suoi ruoli di comando che ho citato prima sono falsi. È una cittadina indipendente che corre con il simbolo del partito.

Ti ringrazio per avermi messo di fronte a questa ennesima imprecisione; mi sono comportato in modo inaffidabile.

Qui ci sono molte cose da dire, per cui cercherò di essere sintetico al massimo.

1) Anzitutto, le spiegazioni fornite dalla AI non sono affatto tali, giacché formano un circolo vizioso: prima, infatti, ha affermato di aver detto che Carlota correva per il Senato in quanto era una figura storica del PM e poi ha detto di avere inventato questa informazione per giustificare l’errore commesso, che però, era stato commesso proprio a causa di questa falsa informazione. Insomma, è nato prima l’uovo o la gallina? Quale dei due errori è stato causa dell’altro e perché si è verificato? L’unica cosa chiara è che la AI non ne ha la minima idea.

2) E proprio qui sta il problema. Noi tutti, compresi quelli che non credono che la AI pensi davvero, di fatto istintivamente tendiamo a comportarci come se lo facesse. Di conseguenza, se commette degli errori, istintivamente ci chiediamo cosa abbia capito male. Ma la AI non capisce nulla e quindi non può nemmeno capire male. Ciò che essa fa è semplicemente cercare le parole che statisticamente si associano più spesso con le parole delle nostre domande, per poi combinarle in un discorso con un capo e una coda in base a regole ricavate anch’esse dalla statistica. Ma che il discorso abbia un capo e una coda non significa che sia vero. Perciò la AI può avere inventato indifferentemente l’una o l’altra delle due risposte false e poi averne dedotto l’altra o anche averle inventate entrambe insieme, sempre in base alle occorrenze statistiche.

3) Questo spiega anche perché la AI si è inventata un intero profilo falso per Carlota, quando per spiegare l’errore di averla candidata al Senato bastava dire che era una figura importante del PM. In realtà la AI non cercava di “spiegare” un bel niente, perché spiegare implica capire e la AI non è in grado di farlo. Il profilo falso è stato creato perché, per qualche ragione, quelle cariche immaginarie si associavano frequentemente al suo nome o a un nome simile o a qualcuna delle altre parole contenute nella mia domanda su di lei.

4) Perché la AI ha ignorato i dati di fatto? Sempre per la stessa ragione. In realtà non li ha affatto ignorati, ma, essendo pochi, perché relativi a un processo elettorale ancora in corso, la loro correlazione con le mie domande era inferiore a quella di altre risposte, false, ma statisticamente prevalenti. Tant’è vero che nella prima risposta aveva addirittura fatto riferimento alle elezioni del 2021 anziché a quelle in corso, come avrebbe fatto qualsiasi essere umano, anche non particolarmente intelligente. Il motivo è che mi ero limitato a scrivere «partido morado voti reali e percentuale» e queste parole risultavano statisticamente collegate molto di più ai risultati delle elezioni del 2021, che, essendosi già concluse, avevano generato molti più articoli su Internet. Solo quando ho chiesto esplicitamente i risultati del 2026 li ho avuti.

5) Sempre per questa stessa ragione, non serve a molto dire alla AI di basarsi solo sui dati reali, come ho fatto io, senza ottenerlo. Ciò, infatti, è soltanto logico, perché in realtà la AI non capisce affatto questo tipo di richiesta, dato che non capisce nulla. L’unico modo in cui può distinguere i dati reali da quelli immaginari è se da qualche parte su Internet vengono esplicitamente dichiarati tali, il che però accade raramente (perché per gli esseri umani in genere questa specificazione è inutile) e quindi non è statisticamente significativo.

6) Poiché questi difetti non dipendono da un malfunzionamento della AI, bensì dal suo funzionamento corretto, potranno forse essere mitigati in futuro, aggiungendo ulteriori parametri (anche se ne vengono già considerati diversi miliardi e ancora non basta), ma non potranno mai essere completamente eliminati. Lo dimostra anche il fatto che sia Gemini che ChatGPT, pur essendo stati costruiti da ditte concorrenti, si comportano in modo praticamente identico, soprattutto quando sono in difficoltà (vedi ancora il già citato https://www.fondazionehume.it/societa/chatgpt-io-e-chat-lo-studente-zuccone/).

7) Neanche correggere le risposte errate della AI serve a molto. A prima vista, guardando le risposte che mi ha dato dopo i miei rimproveri, può sembrare di sì, ma in realtà, se le si osserva un po’ più attentamente, si vede facilmente che la AI si è limitata a parafrasare la mia correzione nella risposta seguente (ancora una volta come fanno gli studenti che non hanno studiato). Purtroppo, però, ciò non influisce realmente su di essa, perché una sola correzione è statisticamente irrilevante, a meno che si tratti di un argomento “di nicchia”, su cui sono disponibili pochissimi dati. E infatti, se uno ripete la domanda, la AI ripete la risposta sbagliata, come è successo a me con la storia di Carlota candidata al Senato, che è tornata fuori quando ho chiesto alla AI di spiegare l’errore. Una nuova verifica effettuata il 3 maggio ha confermato quanto sto dicendo. Con Carlota sono riuscito ad avere finalmente la risposta giusta, ma sul Partido Morado ho di nuovo ricevuto risposte prima vaghe e poi gravemente errate. La migliore, ottenuta dopo diversi tentativi, è stata che «diverse analisi post-voto indicano il Partido Morado come uno dei partiti che rischiano seriamente di non superare lo sbarramento» (grassetto suo, stavolta), mentre con appena lo 0,81% dopo quasi il 90% di sezioni scrutinate questo era ormai assolutamente certo. La differenza tra i due casi è dovuta al fatto che su Carlota c’erano pochissimi dati, per cui le mie correzioni, per quanto poche, erano statisticamente significative e perciò hanno influito sulla nuova risposta, mentre quelle relative al PM si sono perse nel mare di dati che girano sul Web. Solo se tutti gli utenti correggessero sempre tutte le risposte sbagliate della AI si potrebbe sperare di ottenere qualcosa. Ma pensare che ciò possa accadere davvero è irrealistico. Anzi, è certo che accadrà l’esatto contrario.

8) Alla fine di ogni risposta il sistema avverta che «L’AI può commettere errori, quindi verifica le risposte». Ma ciò è possibile solo quando si tratta di un argomento che si conosce bene e perfino in questo caso è tutt’altro che facile. Di fatto, i più prendono per buone tutte le risposte che ricevono e spesso le usano come base per scrivere altre cose, mettendo così in Rete sempre più dati sbagliati, generati dalla stessa AI, che diventa perciò sempre più autoreferenziale e, di conseguenza, sempre più incorreggibile.

9) Poiché la AI si basa sulle statistiche, funziona bene solo quando queste sono precise e affidabili, come accade in ambito scientifico. Nelle cose umane, invece, non è così, soprattutto quando si tratta di eventi “in diretta” (si vedano per esempio le cronache online delle partite di calcio, che da quando vengono scritte dalla AI sono diventate illeggibili), il che la rende strutturalmente inaffidabile, a meno che le si facciano richieste molto precise e limitate, per le quali si può trovare su Internet una risposta praticamente già pronta. Questo, però, di fatto non è altro che un Google migliorato, che potrà anche piacere agli utenti, ma non certo alle ditte produttrici, che hanno investito una quantità spaventosa di tempo e di denaro (vedi Luca Ricolfi: https://www.fondazionehume.it/politica/i-big-dellai-come-i-lemming-svenarsi-per-chatgpt/) avendo di mira ben altro: non un miglior motore di ricerca, ma un Oracolo (basta vedere come si apre la casella di dialogo di Gemini: «Chiedi qualsiasi cosa»).

Così stando le cose, mettere a disposizione di tutti un sistema del genere, intrinsecamente inaffidabile, ma gratuito e attivabile con un semplice click, è come mettere una pistola carica in mano a un bambino. E ancor più preoccupante è il fatto che la AI funziona, almeno parzialmente, anche all’interno della ricerca “normale” di Google.

Anzitutto, infatti, all’inizio della risposta compare spesso la «AI Overview» e ancor più spesso la “tendina” intitolata «Le persone hanno chiesto anche», che di nuovo è palesemente generata dalla AI. Ma quanto esattamente la AI influisce sul comportamento dei motori di ricerca?

Non lo sappiamo e nessuno ce lo dice, ma sappiamo che un ruolo ce l’ha. E, se non ci sarà una decisa opposizione, il suo peso è destinato a crescere sempre più, fino a quando di fatto non ci sarà più alcuna differenza fra le due modalità, il che è esattamente l’obiettivo dei suoi creatori. Ma a quel punto come si farà a “verificare le risposte” della AI, dato che tutto Internet funzionerà ormai con la AI?

La maggior parte degli esperti (che, non dimentichiamolo mai, sono gli stessi che producono questi sistemi e hanno quindi tutto l’interesse a parlarne bene) risponderebbe di certo che ciò accadrà soltanto quando la AI avrà imparato abbastanza da commettere pochissimi errori o addirittura nessuno. Ma non ci vuole molto a capire che si tratta di una menzogna e che in realtà ciò accadrà non appena ci saremo abituati abbastanza ad essa da non porci più il problema dei suoi errori, anche se continuerà a commetterne, perché, per come è costruita, non lo può evitare.

Che i produttori dei sistemi di AI se ne freghino altamente è grave, ma comprensibile. Tuttavia, non potrebbero farlo senza l’appoggio del Partito della Stupidità Artificiale, composto da politici, ma soprattutto da intellettuali (tra cui, ahimè, molti professori universitari) che fanno a gara a prosternarsi davanti ai Signori del Digitale, alcuni per interesse, ma i più per fissazione ideologica o per paura di apparire oscurantisti e arretrati.

E questo non solo è grave, ma non è nemmeno comprensibile.

Il Partido Morado e il Partito della Stupidità Artificiale