Tra le mille ragioni che giustificherebbero la scomparsa di tutti i partiti del “governo Draghi” c’è sicuramente la disonestà intellettuale dei suoi dirigenti ad ogni livello. Gente abituata a recitare la parte del “progressista” nelle interviste e del complice di interessi conservatori nella pratica politica pubblica, legislativa o amministrativa.

Questa critica della recente sortita di Luigi Marattin – pasdaran renziano di Italia Viva – ne è una dimostrazione di livello accademico elevato, che richiede giusto un minimo di volgarizzazione per i non addetti ai lavori statistici. Stabilire una correlazione diretta, oltretutto in termini numerici assoluti, tra fenomeni molto diversi è un’operazione destinata al sicuro fallimento.

Prendendo lo stesso esempio di Marattin – il rapporto tra percettori di reddito di cittadinanza e votanti per Cinque Stelle, intorno a un grafico de IlSole24Ore – potremmo dire che: a) tutti, nella redazione di Contropiano, abbiamo criticato la formulazione del “reddito di cittadinanza” data dal governo Conte 1 (con Salvini dentro); b) nessuno dei nostri redattori percepisce il rdc; c) nessuno di noi ha votato per i Cinque Stelle.

Marattin griderebbe: “ecco un’altra dimostrazione del mio grafico!”.

Peccato che: a) abbiamo criticato il rdc perché troppo basso e con condizioni oscillanti tra l’inesistente e il vessatorio (specie per quanto riguarda le proposte di “correzione” nella logica del workfare); b) i nostri redattori sono lavoratori o pensionati, e dunque non potrebbero neanche chiederlo; c) siamo comunisti e aborriamo il “voto utile” (che stavolta ha premiato più i grillini che non il Pd).

Quindi la “correlazione Marattin”, nel nostro caso, è come aver preso un terno al lotto.

Del resto, basta pensare al fatto che l’insieme “percettori di reddito di cittadinanza” è una quantità basata su una relazione univoca (ci sta entro solo chi lo prende), mentre mettere una croce su una scheda è un atto orientato da una serie di fattori individuali di fatto infiniti.

Detto in altro modo: un percettore di rdc può votare per chiunque (per ragioni ideologiche, perché conosce un candidato, perché iscritto a quel partito, ecc) al pari di chi vive con redditi di natura diversa. Capita per esempio, e purtroppo, che lavoratori poveri votino per partiti che da 40 anni brigano per ridurre il loro salario, distruggere la sanità pubblica, aumentare l’età pensionabile, ridurre i loro diritti sindacali, ecc. Valesse qualcosa la “correlazione Marattin”, Pd, Forza Italia e Lega non dovrebbero prendere un voto…

E qui – per maggiore e ulteriore chiarezza – riproponiamo i dati de Il Sole 24 Ore (articolo postato prima) ma in formato grafico: per ciascuna regione, il confronto tra numero assoluto di percettori di Rdc e numero assoluto di voti al M5S. pic.twitter.com/h4B0RiH592 — Luigi Marattin (@marattin) September 28, 2022

Certamente in ambiti territoriali in cui l’offerta di lavoro scarseggia ed aumentano i percettori di rdc si innesca una “ambiente favorevole” al voto per i Cinque Stelle (“hanno fatto qualcosa per quelli come noi”), piuttosto che per chi vuole toglierlo. Può votare M5S, insomma, anche il negoziante o il benzinaio i cui clienti, in gran numero, possono spendere solo se prendono il rdc. Così come in un posto dove il lavoro c’è, ma è precario e sottopagato, può esserci una minoranza che vorrebbe poterne usufruire.



Non c’è insomma una relazione diretta tipo quella che si stabilisce nel “voto di scambio” mafioso o clientelare (il secondo ampiamente praticato da tutti i partiti di potere): voto in cambio di un favore diretto, non di un “diritto opzionale” sottoposto a (possibili) verifiche fiscali o di altro tipo.

Ma se non è possibile stabilire una relazione diretta tra due fenomeni così diversi ne deriva che ogni generalizzazione sui risultati numerici vale quanto la constatazione della massaia che dice “ogni volta che stendo i panni piove”. Qualche volta sì, altre no. Certi anni più spesso, altri – come questo – quasi mai.

Non si fa così scienza. Ma da un docente di una prestigiosa università ci si attende appunto che applichi metodologie scientifiche e non cerchi consensi grossier sulla base di correlazioni “a naso”. Quelle, insomma, che servono ad alimentare il qualunquismo politico e lo spirito reazionario della società.



Ma lasciamo ora l’analisi a chi certamente capisce più di noi di metodologia statistica.

Buona lettura.

*****

Il tweet di Luigi Marattin sul grafico che, a suo dire, dimostrerebbe di per se’ una solida correlazione tra numero assoluto di percettori di RDC e voti dati al M5S (sempre in termini assoluti) ha destato un accesa polemica.

L’uso improprio dei dati (ossia confrontare dati assoluti su varie regioni senza considerare misure standard come le percentuali) denota una superficialità di pensiero, quando non addirittura e non disonestà intellettuale (nel momento in cui il lettore è indotto a credere ad un nesso causale tra le due cose) che sono costanti del dibattito politico attuale da molto tempo.

Vagliare il grado di competenza o di onestà della persona non è nostro compito. Semmai giova al lettore capire il fondamento metodologico (in questo caso, della sua completa assenza) in simili circostanze.

A questo scopo, riportiamo le conclusioni di un vecchio articolo di Herbert Simon, nome che al Marattin (Professore Associato alla prestigiosa Alma Mater Studiorum nel tempo libero dalla lotta politica) dovrebbe dire qualcosa.

L’articolo, intitolato “Spurious correlation: a causal interpretation”, è stato pubblicato nel 1954 sul Journal of the American Statistical Association, volume 49, numero 267, pagg. 467-479. Riportiamo la traduzione a nostra cura e la relativa spiegazione per ciascuno di essi. L’originale è facilmente scaricabile via Google.

1) “In questo articolo si chiariscono i processi logici e le ipotesi che sono coinvolti nelle procedure usuali per verificare se una correlazione tra due variabili è vera o spuria. Queste procedure iniziano inserendo la relazione tra le due variabili in un più ampio sistema a tre variabili che si presume sia autonomo, ad eccezione dei disturbi stocastici o dei parametri controllati da uno sperimentatore.”

Quindi si noti: per verificare la effettività di una correlazione tra DUE variabili (diciamo x e y) si deve aggiungere almeno una terza. Perché questo? E’ il vizio dello statistico (ma in generale dell’uomo di scienza) voler sempre mettere in dubbio l’autorità dell’opinione comune (costituita da un sistema ridotto a sole affermazioni auto-provanti).

I disturbi stocastici e i parametri controllati dallo sperimentatore sono le classiche alee che caratterizzano un qualunque sistema economico appena più complesso dell’isola di Robinson Crusoe. Sistema non conforme al mondo semplice di Marattin, che si guarda bene dal provare cosa succede con altre variabili. E, solo da ultimo, dal rendere logicamente omogenei i valori assoluti usati per confermare la tesi (esplicita e tautologica) del Nostro.

2) “Poiché i coefficienti nel sistema a tre variabili non saranno in generale identificabili, e poiché la determinazione dell’ordinamento causale implica identificabilità, il test di spuriezza della correlazione richiede ulteriori assunzioni da fare”.

Qui comincia la parte difficile. L’identificazione è il problema centrale della moderna scienza economica e in particolare dell’econometria. Identificare significa provare una relazione uno-a-uno tra un insieme di fenomeni (che sono per definizione misurabili attraverso variabili aleatorie) e un insieme di parametri che riassumono un certo ammontare di informazioni osservabili (i mitici “dati”).

Trovare questa relazione uno-a-uno non è mai un opera semplice. Si pubblica sulle migliori riviste scientifiche di settore, se si riesce a trovare un modo efficace di identificare un modello economico su dati (di solito, caratterizzati da complicazioni di sorta come correlazione seriale, nonlinearità, non-stazionarietà, tutte cose a loro volta valse vari Nobel per l’Economia).

E perchè questo? Perché non si può giungere a considerazioni di causalità tra x e y se non si decide a monte in che ordine queste due sono con un’altra variabile z., posta come “variabile di controllo”. Senza di questa, ripetiamo, siamo nel mondo della tautologia.

Solo a questo punto è possibile applicare un test formale per l’ipotesi di spruriezza. Test che, ripetiamo, richiede ulteriori assunzioni tecniche. E quali sono queste ipotesi? Si veda il seguente.

3) “Queste ipotesi sono generalmente di due tipi. Il primo tipo, normalmente esplicitato, è il presupposto che alcune variabili non abbiano un’influenza causale su altre. Queste ipotesi riducono il numero di gradi di libertà del sistema di coefficienti implicando che tre coefficienti specificati sono zero.

Il secondo tipo di ipotesi, più spesso implicita che esplicita, è che i disturbi casuali associati al sistema a tre variabili non siano correlati. Questa ipotesi ci fornisce un numero sufficiente di restrizioni aggiuntive per garantire l’identificabilità dei coefficienti rimanenti, e quindi per determinare l’ordinamento causale delle variabili.”

Quindi la logica è: “(i) sistema a tre, (ii) esistenza di disturbi; (iii) correlazione tra le tre variabili; (iv) causalità“. La causalità altro non è che una verifica dell’intensità di coefficienti di questo sistema ampliato. Se questi coefficienti non sono statisticamente rilevanti, non può esistere causalità.

Ci sarebbe poi anche la causalità nel senso di Granger, premio nobel dell’Economia nel 2003 e pioniere della moderna Econometria delle serie temporali, ma non ci sembra il caso di infierire sulla pazienza del lettore. Si veda Granger, CWJ. “Investigating Causal Relations by Econometric Models and Cross-spectral Methods”. Econometrica. 37 (3): 424–438.

Vorremmo concludere con la seguente considerazione: nel mondo degli economisti à la Marattin, il Simon viene ricordato (sempre più di rado, peraltro) come “quello dell’Organizzazione Aziendale”. Infatti, la motivazione del premio A. Nobel per l’economia assegnatogli nel 1978 risulta essere “per le sue ricerche pionieristiche sul processo decisionale nelle organizzazioni economiche”.

Come abbiamo avuto modo di vedere fu molto altro: uno statistico, prima di tutto; in secundis, un pioniere dell’Intelligenza Artificiale, del problem solving e delle simulazioni al computer. Poi, scrisse anche di Psicologia cognitiva e di Filosofia della Scienza. Ed infine, fu anche uno dei primi studiosi dei sistemi complessi, quelli che hanno valso il Nobel della Fisica a Giorgio Parisi poco tempo fa.

E il nostro economista di apparato di oggi è rimasto ancora alla “correlazione spuria”…

