Ita

dk10x37 - Intanto, in Germania...

LLM contro giornalismo, il caso di uno scandalo tedesco.

Qualche giorno fa mi ha divertito leggere di quello che qui in Germania è uno scandalo: si è scoperto che l'ex editore e caporedattore e ora opinionista del Tagesspiel di Berlino, tale Carl-Andreas Casdorff, ha usato l'"Intelligenza Artificiale" per scrivere i suoi pezzi d'opinione.

Non ridete, qui in Germania non hanno quelli del Foglio, e la professione giornalistica ha ancora una certa dignità , almeno per ora. (A proposito, come va il Foglio AI? Hanno già decuplicato le copie e decimato i costi?)

Ad ogni modo, scoperta la cosa la direzione del Tagesspiel ha rimosso dal sito l'articolo incriminato e altri sospetti mentre indagano, sospendendo temporaneamente l'opinionista che ha fatto il doveroso mea culpa:

«Ho commesso un errore madornale, danneggiando la reputazione della testata e la mia. Per questo porgo le mie più sincere scuse. Nei testi ho utilizzato l’"Intelligenza Artificiale". Avrei dovuto chiarirlo e, di conseguenza, non avrei dovuto consentirne la pubblicazione».
dw.com, 21 giugno 2026

Casdorff evidentemente incarna lo Zeitgeist, lo spirito del tempo, perché negli stessi giorni un'altra testata, la Frankfürter Allgemeine Zeitung (FAZ) di Francoforte, ha rimosso dal sito il corsivo rilasciato da premier della Turingia, anche quello scritto con la cosiddetta "Intelligenza Artificiale", cioè con un modello linguistico.

E siccome in Italia siamo cialtroni mentre in Germania sì che sono gente seria, sulla questione è sceso in campo nientemeno che Mathias Döpfner, il CEO di Axel Springer.

Il quale buontempone, per stigmatizzare la decisione della FAZ, non ha trovato di meglio che chiedere anche lui a un modello linguistico un commento polemico che accusava la FAZ di rifiutare le tecnologie moderne, e paragonava la loro decisione a "un tentativo disperato della lobby delle carrozze per proibire le automobili".

Sono sicuro che Herr Döpfner pensa di essere molto furbo e intelligente, e infatti fa il CEO. Io però penso che si tratti solo di un sussiegoso imbecille, e che nello specifico, la sua profondità di analisi sulla questione tecnologica è inferiore a quella reperibile in un ragazzo del liceo.

Il cosiddetto "rifiuto delle nuove tecnologie" è l'argomento del padronato dall'invenzione del telaio a vapore, e dopo secoli come argomento è ancora una cagata pazzesca.

Il punto è che nessuno "rifiuta" (si sentono le virgolette?) le nuove tecnologie, per il semplice fatto che l'accettazione di una tecnologia è una scelta sociale, senza nessuna inevitabilità. La storia è piena di tecnologie che come società abbiamo semplicemente scelto di scartare.

La schiavitù, il lavoro minorile, la servitù debitoria come quelli di Downton Abbey, l'amianto, le armi chimiche, le mine antiuomo, la sorveglianza indiscriminata, certi farmaci, penso al talidomide, certi diserbanti, certe modifiche genetiche negli alimenti, negli animali e nell'uomo…

La questione della inevitabilità di certe tecnologie, il "questo è il futuro, adeguatevi o estinguetevi" nasce dall'incontro fra il libertarismo degli anni '60 statunitensi, e il libertarismo capitalista, quella che è stata battezzata "ideologia californiana".

Per una dimostrazione rapida di quello che sto dicendo, potete semplicemente ricordare che gli stessi argomenti (e spesso le stesse persone) che oggi sostengono l'inevitabilità dei modelli linguistici spacciati per "Intelligenza Artificiale" soltanto ieri venivano usati paro paro per dire che era inevitabile il Metaverso. E l'altro ieri venivano usati per la blockchain.

O, se volete fare gli sciccosi, potete rispolverare un Keynes d'annata (1930) e la sua previsione che la settimana lavorativa nel 2030 sarebbe stata di 15 ore.

Chi la mena con "il futuro sarà così e cosà", vuole soltanto vendere qualcosa, non foss'altro che se stesso come "futurologo". Che poi è solo un astrologo meno fantasioso, ma è pur sempre meglio che lavorare.

A questo punto entra in gioco anche una ricercatrice, Vera Katzenberger dell'università di Lipsia, che dice che il caso di Casdorff è importante perché fa vacillaree la fiducia nel giornalismo; il pubblico legge i giornali per l'esperienza o le prospettive di certi autori, e se i corsivi sono generati dall'"Intelligenza Artificiale", c'è un'interferenza nel modo in cui si forma la pubblica opinione; il pubblico potrebbe sentirsi ingannato.

E fin qui non ho niente da dire, ma poi la Katzenberger specifica:

Questo è un problema perché l'"Intelligenza Artificiale" non ha valori, non ha posizioni politiche, e non ha senso di responsabilità.
(ibid.)

Eh no. Uno su tre, da una ricercatrice ci aspettiamo di più.

Come sempre, il problema è il linguaggio con cui parliamo della cosidetta "Intelligenza Artificiale". Intanto è sbagliato e controproducente chiamarla così, noi stiamo parlando di modelli linguistici, cioè di motori statistici per la generazione di testi plausibili.

O, se vogliamo usare la mia nomenclatura preferita, stiamo parlando di generatori di stronzate. Che i testi siano plausibili non toglie niente al fatto che sono testi generati tirando dei dadi.

E poi ci si ostina a usare un linguaggio antropomorfico, a parlare dei modelli linguistici come se stessimo parlando di persone.

Un modello linguistico, che è un programma, non "ha" caratteristiche nel senso in cui le ha un essere umano, o un qualunque essere vivente, che possa è solo il delirio di quelli che fanno della tecnologia una religione; e dei pubblicitari, che ti dicono che il frigorifero, il deodorante o la berlina che devono vendere ha un "carattere".

Un modello linguistico al massimo può esibire dei bias nel modo in cui avviene la generazione del contenuto, se il bias è presente nei dati di addestramento o è fornito esplicitamente come istruzione (i cosiddetti"guardrail" non sono altro che indirizzamenti preferenziali dei risultati del motore).

Una piccola spiegazione tecnica. I modelli linguistici sono una applicazione delle tecniche chiamate di "machine learning": a un programma vengono forniti dei dati e il programma "apprende" (si sentono le virgolette?) cioè individua relazioni ricorrenti fra quei dati. Fornite dieci milioni di foto di gatti al machine learning, e il programma riesce a individuare se c'è un gatto in una nuova.

Il programma ha capito cosa sia un gatto? Certo che no. Sa soltanto come sono distribuiti i colori e le forme nelle foto di gatti che ha visto. Fornite una nuova foto, e il programma dirà se la foto contiene un gatto. A volte la risposta sarà corretta.

Fornite qualche al programma qualche miliardo di pagine scritte, e il programma ricostruisce dagli esempi che riceve le regole che governano la costruzione di frasi di senso compiuto.

Il programma ha imparato a parlare e a rispondere? No. Ma ha analizzato abbastanza domande e risposte da poter costruire una frase di risposta quando gli date una frase di domanda. A volte, la frase di risposta è di senso compiuto, e a volte è addirittura giusta.

Il programma esegue le stesse istruzioni, sia per fornire una risposta che noi riconosciamo come giusta, sia per una risposta che noi riconosciamo come sbagliata. Nel programma non c'è alcuna conoscenza, o modello del mondo, o vincolo di realtà. Il programma genera frasi, è l'utente che le valuta rispetto alla realtà.

Quindi sì, ovvio che il programma non ha alcun senso di responsabilità, il programma vede solo le correlazioni fra le parole della lingua che parliamo, e il senso di responsabilità non è lì più di quanto sia in una moneta lanciata o in una pallina della roulette, che pure, se prendiamo per buoni i ragionamenti dei techbro, anche loro decidono cose.

Un altro piccolo intermezzo tecnico.

Il Machine Learning funziona. Ma la qualità del suo funzionamento si basa sulla qualità dei dati di input. Il vecchio adagio "Garbage In, Garbage Out" vale per i modelli linguistici di oggi come per i programmi FORTRAN o COBOL di sessant'anni fa.

Prima di creare DataKnightmare, per un breve periodo ho pensato di poter fare Data Science. E quindi avevo creato la mia metodologia che avevo chiamato Ottuplice Via alla Data Science, sulla falsariga dell'ottuplice via per la virtù nel Buddismo.

I primi tre passi erano:

corretta scelta delle fonti, cioè da dove raccogliamo i dati
corretta raccolta dei dati, cioè quali dati prendiamo fra quelli disponibili
corretta validazione dei dati raccolti, cioè controllare che i dati siano nel formato richiesto e abbiano i valori che ci aspettiamo. Per dire, una data è una data, ma giorno-mese-anno o mese-giorno-anno o anno-mese-giorno?

Ora, il punto era semplice. Non basta prendere dei dati. Occorre sapere che dati sono, come sono stati raccolti, occorre controllare eventuali errori o parzialità nella raccolta.

Questo è il motivo per cui ho mollato la Data Science: io parlavo di una disciplina, i dirigenti dicevano "boh, abbiamo questi dati, cerchiamo di farci qualcosa, e già che ci siamo facciamo in modo che questo qualcosa ci dica quello che vogliamo sentire".

Perché è facile dire che l'azienda è data driven, ma se il dirigente dice una cosa e la statistica dice l'opposto, che figura ci fa il dirigente?

Io vedevo i dati come strumento di indagine della realtà e guida nelle decisioni. I dirigenti vedevano qualcosa con cui giustificare le proprie decisioni ammantandole di una oggettività che non avevano.

Detta come va detta: la quasi totalità degli archivi aziendali non vale assolutamente nulla ma può essere usato per giustificare una cosa o il suo opposto, per il fatto che non c'è alcun controllo sulla qualità dei dati raccolti.

A questo punto cosa possiamo dire dei modelli linguistici come applicazione del Machine Learning? Il loro input è indiscriminatamente tutto il testo, di qualsiasi tipo, reperibile su Internet. E su Internet sappiamo che c'è tutto e il contrario di tutto. Ma non in parti uguali.

Ci sono materiali dettagliati, precisi, rigorosi, per produrre i quali qualcuno ha studiato e lavorato per anni.

E ci sono stupidate, cose volutamente finte, teorie della cospirazione, deliri, forum di sciroccati e neonazisti, cose che mi ha detto mio cuggino che lui ne capisce, eccetera eccetera.

Queste ultime sono enormemente più diffuse rispetto ai primi, ma il modello linguistico ingurgita tutto senza distinguere, e poi fa la media. Anche senza essere esperti di qualità dei dati, che livello di qualità avrà il risultato?

Quando dico che i modelli linguistici sono l'applicazione più stupida e bruta del machine learning, intendo questo.

Quello a cui vi rivolgete cercando risposte per la vostra vita, per la vostra salute, per il vostro lavoro e che chiamate "Intelligenza Artificiale" perché di quello vi hanno detto che si tratta, non è altro che la media pesata di tutto quello, fiori e merda, che si trova su internet, frullata, dolcificata, colorata del vostro colore, e impiattata, e voi ve la mangiate come se fosse una prelibatezza.

Non sto dicendo che siete stupidi, sto dicendo che vi hanno preso per il culo e vogliono continuare a farlo ma a pagamento.
Potete anche smettere di dargli retta.

OK, scusate la digressione ma le cose vanno capite, ora torniamo a bomba. La ricercatrice di Lipsia ci dice che il problema è che:

...l'"Intelligenza Artificiale" non ha valori, non ha posizioni politiche, e non ha senso di responsabilità.
(ibid.)

Abbiamo capito che "Intelligenza Artificiale" è un nome fuorviante, ma comunque la sola traccia di "senso di responsabilità" in un modello linguistico possono essere al massimo (dico al massimo perché poi esiste Grok) le cosiddette "guardrails", quelle istruzioni a posteriori che dovrebbero (il condizionale ipotetico è d'obbligo) impedire che il modello linguistico vi spieghi come produrre un'arma chimica o si metta a fare discorsi neonazisti.

Sappiamo benissimo che i guardrail funzionano solo nella mente di chi deve venderli, perché vanno contro al fatto ineludibile che un motore statistico funzionerà come un motore statistico anche se gli diciamo di non farlo. I "guardrail" sono come scrivere "non uscire" su cinque facce di un dado e sperare che grazie a questo esca sempre la sesta. Davvero, è questo che vi stanno vendendo.

E i valori, e le posizioni politiche? Quelli rifletteranno i dati di input, e quindi saranno fortemente a favore dei valori e delle posizioni numericamente più ripetute, giuste o sbagliate che siano. Aprite instagram o qualsiasi social e fatevi iun'idea.

Come ciliegina sulla torta, poi, c'è sempre la possibilità che il padrone del modello linguistico metta degli altri "guardrail" a difesa dei valori e delle posizioni politiche che preferisce, o che gli fanno comodo. E naturalmente non è tenuto a farne parola con chicchessia.

Ecco. Per come la vedo io, il problema non è che il modello linguistico non ha valori o posizioni politiche. Il modello linguistico riflette come minimo i valori e le posizioni più presenti in rete, e già quello è un problema. E magari ha anche qualche ulteriore aiutino. Considerare uno strumento del genere come politicamente neutro è pura follia.

E non basta. Perché c'è già uno studio che mostra come anche solo usandolo per una stesura iniziale, il modello linguistico influenza il linguaggio che comparirà nella versione finale, sia dal punto di vista stilistico, che di vocabolario, che di contenuti.

Un corsivista che si lascia imboccare dal modello linguistico foss'anche solo per fare brainstorming o per usarlo come userebbe un ascoltatore umano, sta accettando di essere condotto, lentamente ma inesorabilmente, nel migliore dei casi verso valori e posizioni medi accettabili, e nel peggiore, verso valori e posizioni preferiti dal padrone del modello linguistico.
Gaslighting as a Service, ma che bella idea.

Il modello linguistico non si stanca mai, parla e risponde come una persona, e noi ci siamo evoluti per ascoltare le persone, non per trattarle come oggetti. Quindi quando il modello ti mette di fronte a un argomento che magari non avresti mai usato, tu non rifiuti a priori, lo giri e lo rigiri, cambi un po' lo stile e magari te lo fai andare bene. In altre parole hai deciso cosa pensi con un lancio di dadi, magari pure truccati.

Non mi piace dire cose ovvie, ma c'è questa bella citazione da Dune, di Frank Herbert:

Un tempo, gli uomini affidarono alle macchine il compito di pensare per loro nella speranza che ciò li rendesse liberi. Ma ciò permise solo ad altri uomini che possedevano le macchine di ridurli in schiavitù.

Compite un atto rivoluzionario: pensateci.

dk10x37 - Intanto, in Germania...

Read more

Meanwhile, in Germany...

DK 10x36 - SpaceX, ma anche i tramvieri laidi

Loss-sharing

DK 10x35 - Partecipazione alle perdite