LOGICA INDUTTIVA
Fra le interpretazioni che nel passato furono date della l. i. la più nota si deve a J.S. Mill, secondo cui questa è la l. della scoperta scientifica. Se, come si credeva, l'induzione è il processo mediante il quale si perviene alla formulazione delle leggi scientifiche, la l. i. è l'analisi formale della struttura dei metodi che consentono la suddetta formulazione, la specificazione dei metodi atti a individuare tali strutture. È appena il caso di aggiungere che tanto questo modo d'intendere l'induzione quanto i metodi di Mill, cioè la formalizzazione dei metodi d'induzione, conservano solo un interesse storico. In tempi a noi più vicini, l'induzione è stata intesa come il processo mediante il quale assegnare valori di probabilità alle leggi scientifiche pensate come leggi strettamente deterministiche. Queste − individuate secondo procedimenti di volta in volta diversi che, comunque, non possono essere ridotti a schemi universali − vengono accolte come dati: a esse, poi, sulla scorta delle osservazioni sperimentali disponibili, si attribuiscono valori di probabilità. Si supponeva quindi che la l. i. fosse l'analisi formale delle modalità mediante le quali vengono determinati questi valori di probabilità. Dal momento che non si riteneva possibile assegnare alcun valore di probabilità senza prima aver chiarito il significato di questo termine, la l. i. era intesa come il complesso di studi e ricerche volti alla definizione del termine ''probabilità'', cioè i fondamenti della probabilità. Questa è sostanzialmente la posizione di R. Carnap, uno dei massimi studiosi di l. i. del Novecento.
Ma anche questo modo d'intendere la l. i. non ha retto alle critiche delle quali la principale consiste nel rammentare che, limitandosi ai fondamenti della probabilità, si trascurano quelli della statistica.
La gravità di questa trascuratezza si coglie quando si pensi alla rivoluzione che, a cavallo tra Ottocento e Novecento, è avvenuta nelle più avanzate teorie scientifiche, in particolare nel campo della biologia e della fisica. Com'è noto, questa rivoluzione è consistita nell'uso di leggi scientifiche non più solamente deterministiche bensì anche statistiche (indeterministiche o probabilistiche).
A partire dai primi suggerimenti di G. Mendel, J.C. Maxwell e L. Boltzmann, le leggi statistiche hanno assunto nella scienza un'importanza via via crescente. Da eccezionale, legato com'era all'impossibilità, ritenuta pratica, di determinare con precisione le condizioni iniziali di insiemi di individui il cui comportamento si pensava regolato dalle rigorose leggi della meccanica newtoniana, l'uso delle leggi statistiche nella scienza si è a tal punto esteso da far ritenere, a schiere numerose di scienziati, essere la formulazione più profonda delle leggi della natura. Valga l'esempio della meccanica quantistica, senza dubbio la più avanzata fra le discipline scientifiche contemporanee, per la quale le leggi sono esclusivamente di natura statistica.
La statistica è pertanto l'insieme dei metodi che consentono di pervenire alla formulazione delle leggi statistiche o, come si usa dire in termini tecnici, all'individuazione delle distribuzioni di probabilità. Ne consegue l'impossibilità, a meno di forzature legate a intenti didattici, di tracciare una netta linea di demarcazione fra gli studi di probabilità e quelli di statistica. Sarà quindi più opportuno parlare di discipline statistico-probabilistiche e qualificare con lo stesso aggettivo i concetti e i metodi che vengono impiegati ed elaborati all'interno delle suddette discipline.
Va da sé che fra le discipline di cui abbiamo appena parlato non vi sono solamente quelle tradizionalmente deputate alle ricerche relative alle distribuzioni di probabilità e alla statistica, descrittiva e inferenziale (matematica o induttiva), ma anche tutte quelle discipline in cui si faccia uso di nozioni e metodi statistico-probabilistici. Come discipline di questo tipo intenderemo, quindi, sia la meccanica quantistica sia la genetica di popolazioni, sia infine la termodinamica statistica e l'econometria.
In accordo con questo modo d'intendere le discipline statistico-probabilistiche, la l. i. può, in prima istanza, essere vista come l'analisi formale dei concetti e dei metodi statistico-probabilistici elaborati in qualunque ambito della ricerca scientifica. Dal momento che tanto gli uni quanto gli altri sono stati elaborati in vista della determinazione di distribuzioni di probabilità, ossia di leggi statistiche, è opportuno ricordare, sia pure per grandi linee, cosa si debba intendere per una distribuzione di questo tipo.
Una legge deterministica asserisce che tutti gli individui di una popolazione godono di una certa proprietà. Un esempio di legge di questo tipo è l'affermazione secondo cui tutti gli esseri umani hanno una statura inferiore a tre metri. Detto con altre parole, una legge deterministica afferma che tutti gli individui considerati, senza eccezione alcuna, hanno data caratteristica.
Una legge statistica è invece un'affermazione secondo la quale non tutti gli individui della popolazione godono della medesima proprietà, in essa vi sono cioè individui che godono di una o l'altra delle proprietà di un gruppo determinato, per es. quelle delle stature. L'affermazione secondo la quale metà degli esseri umani ha statura inferiore o uguale a un metro e mezzo e l'altra metà ha statura superiore a questo valore, è una legge statistica. Nell'esempio appena visto abbiamo considerato solo due proprietà, più precisamente ci siamo occupati di una proprietà e della sua negazione. Naturalmente nulla cambia se si considerano più proprietà senza privilegiarne alcuna, senza cioè considerare come eccezioni quegli individui che non godano di una fra le proprietà considerate. Per es., una distribuzione che accanto a ogni intervallo di stature, diciamo cinque centimetri, precisi il numero degli esseri umani che hanno una statura compresa in questo intervallo, è molto simile a una legge statistica. Perché diventi una legge di questo tipo è sufficiente passare dai numeri, le frequenze, di coloro che hanno statura compresa nell'intervallo, alle frequenze relative, cioè ai rapporti fra i numeri suddetti e quello di tutti gli esseri umani che abbiamo considerato. Questo rapporto può essere riferito a cento, sarà allora una percentuale; oppure a mille o, come si è soliti fare, potrà essere una probabilità, cioè un numero compreso fra zero e uno.
Una legge statistica, quindi una distribuzione di probabilità, è pertanto l'enumerazione di tutte le proprietà di un certo gruppo e delle corrispondenti probabilità. Trascurando ulteriori precisazioni, una legge statistica stabilisce la probabilità con la quale un individuo della popolazione gode di una delle proprietà di un gruppo. Di questa definizione di legge statistica, indubbiamente sommaria ma sufficiente ai nostri scopi, ci serviremo al fine di descrivere la struttura logica delle inferenze statistiche intese come l'insieme dei concetti e dei metodi che consentono la determinazione delle leggi statistiche. Queste inferenze possono essere suddivise in tre grandi classi: le inferenze statistiche ipotetico-deduttive, le inferenze statistiche ipotetico-induttive, e infine, le inferenze statistiche induttive (v. anche inferenza statistica, in questa Appendice).
Come si vede, il termine ''induttivo'' è legato alle inferenze di una sola classe, mentre in un'altra è accomunato al termine ipotetico; ciò dipende dalla storia del concetto d'induzione. A lungo, come si è visto, si è dato a questo termine un significato diverso, sostanzialmente restrittivo, da quello che gli abbiamo attribuito. I nomi delle classi d'inferenze statistiche riflettono questo sviluppo storico. Il termine ''induttivo'' si è riservato alle inferenze più vicine al modo tradizionale d'intendere l'induzione. L'aggettivo ''ipotetico-induttivo'' è relativo a quelle inferenze che, pur essendo sostanzialmente induttive, si basano su un'assunzione della cui validità non si è certi. Infine si è riservato l'aggettivo ''ipotetico-deduttivo'' a quelle inferenze che risultano dall'estensione alle leggi statistiche del metodo ipotetico-deduttivo galileiano.
Dalla precisazione che abbiamo fatto risulta un modo d'intendere la l. i. che vale la pena di esplicitare. La l. i., cioè l'analisi formale dei concetti e dei metodi statistico-probabilistici, è l'analisi formale di ogni tipo d'inferenza ampliativa, cioè di quel tipo di argomentazioni che partendo dalla constatazione dei dati di fatto, le premesse, conducono a conclusioni che vanno oltre le premesse, nel senso che non sono da queste logicamente implicate. Ciò significa che un'argomentazione di questo tipo, cioè un'inferenza statistica, pur prendendo le mosse da osservazioni e pur essendo logicamente corretta, può condurre a conclusioni false.
Quanto detto ci consente dunque una formulazione molto chiara di ciò che intendiamo per l. i.: l'analisi formale delle inferenze ampliative. Sulla base di questa definizione possiamo individuare, per grandi linee, la struttura logica delle inferenze statistiche.
Le inferenze statistiche ipotetico-deduttive mirano alla corroborazione delle leggi statistiche. Il metodo ipotetico-deduttivo consiste nell'ipotizzare la validità di una legge deterministica, nel trarre da questa delle conseguenze da confrontare con le osservazioni sperimentali al fine di accertare se quelle siano conformi a queste. In caso di conformità la legge è corroborata; in caso di difformità la legge, falsata, viene rigettata. Ovviamente, mentre il falsamento è definitivo, la corroborazione è solo provvisoria dal momento che successive osservazioni potranno falsare la legge.
Per una legge statistica le cose non possono essere così semplici dal momento che una legge di questo tipo, contemplando la possibilità di eccezioni, non può in alcun modo essere falsata. È quindi necessario fare riferimento a una nuova nozione, convenzionale, di falsità: la chiameremo falsità debole. Se è innegabile che qualunque osservazione sperimentale non può, in senso stretto, essere in contrasto con una legge statistica, le possibili osservazioni non hanno, data la legge statistica, la medesima probabilità. Per es., se supponiamo che un'urna contenga solo palline di due colori e che il numero di quelle bianche sia pari a quello delle palline nere, è evidente che se estraiamo dieci palline la probabilità che esse siano tutte nere è molto minore della probabilità che le palline estratte siano metà bianche e metà nere. Ebbene, la nozione di falsità debole in uso nelle inferenze statistiche ipotetico-deduttive è connessa a questa differenza fra le probabilità degli esiti. Diremo che una legge statistica è falsata, debolmente, se è piccola la probabilità che essa assegna alle osservazioni effettivamente compiute. Più esplicitamente, ogni legge statistica assegna valori di probabilità a tutti i possibili esiti di un'osservazione sperimentale; fra questi l'osservazione consente d'individuarne uno; se è piccola la probabilità di questo esito, determinata supponendo la validità della legge, allora questa è debolmente falsata.
Con la convenzione che abbiamo testé detto il metodo ipotetico-deduttivo diviene applicabile alle leggi statistiche. Anche un'inferenza statistica ipotetico-deduttiva termina quindi con la corroborazione o il falsamento della legge in esame. Per le ragioni che abbiamo già visto, la corroborazione è provvisoria, ma ora lo è anche il falsamento, dal momento che ulteriori osservazioni, modificando la probabilità delle osservazioni compiute, potrebbero condurre a un aumento della probabilità e pertanto alla corroborazione della legge.
Le inferenze statistiche ipotetico-induttive mirano a modificare la probabilità delle leggi statistiche di una classe a seguito delle osservazioni sperimentali. L'aspetto induttivo dell'inferenza risiede nel fatto che essa prende le mosse da certi valori di probabilità iniziali per le leggi della classe e, tramite le osservazioni sperimentali, perviene a nuovi valori di probabilità, finali, per le stesse leggi. L'aspetto ipotetico dell'inferenza lo si riscontra nel fatto che solo le probabilità delle leggi della classe considerata vengono modificate a seguito delle osservazioni. Le probabilità di tutte le leggi non appartenenti alla classe sono nulle prima delle osservazioni e restano tali anche dopo. Ne consegue che se le informazioni possedute prima dell'esperimento sono sufficienti a individuarne la classe cui appartiene la legge che regola il fenomeno che stiamo studiando, allora l'inferenza consentirà di aumentare induttivamente le conoscenze su questa legge. Quando ciò non si verifichi e si accolga ipoteticamente la validità di una classe di leggi fra le quali non v'è quella che regola il fenomeno in esame, allora la probabilità di questa legge non viene modificata a seguito delle osservazioni. Da quanto si è detto segue l'importanza delle ricerche relative alla specificazione delle classi di leggi da impiegare nel corso di questo tipo d'inferenza statistica e, parimenti, di quelle relative all'esplicitazione di classi sufficientemente ampie da poter essere impiegate anche in circostanze molto diverse.
Un altro problema di grande importanza nello studio di questo tipo d'inferenze statistiche è connesso all'individuazione delle probabilità iniziali per le leggi statistiche della classe di cui, ipoteticamente, si è assunta la validità. Non è certo difficile immaginare che quando il numero delle osservazioni compiute non sia molto elevato mutando le probabilità iniziali possono mutare anche profondamente le probabilità finali. Da qui la necessità di precisare nel modo migliore le probabilità iniziali e, quando ciò non sia possibile, di aumentare il numero delle osservazioni.
Le inferenze statistiche induttive non privilegiano alcun gruppo di leggi ma, avendone scelta una, seguono un percorso che, sostanzialmente, viene delineato dalle osservazioni sperimentali. La struttura di questo tipo d'inferenza statistica può essere individuata nel modo seguente: si ipotizza la validità di una legge statistica per il fenomeno che stiamo considerando; si eseguono le osservazioni; ciascun esito modifica, in una misura che dev'essere fissata prima dell'inferenza, la legge statistica di partenza in modo tale che, alla fine delle osservazioni, saremo pervenuti a una legge che potrà anche essere molto diversa da quella da cui si sono prese le mosse.
Da un altro punto di vista, un'inferenza induttiva si qualifica come una sorta di media ponderata fra le informazioni, espresse da leggi statistiche, che si posseggono prima delle osservazioni e quelle che gli esiti sperimentali mettono a nostra disposizione. La legge statistica con cui termina l'inferenza è il risultato della reciproca influenza di questi due tipi d'informazioni, influenza fissata da un parametro il cui valore dev'essere scelto in modo indipendente dall'inferenza. Di qui la grande importanza di fissare questo parametro: dal suo valore, infatti, dipende se la legge con cui si conclude l'inferenza sarà più influenzata dalle informazioni precedenti l'osservazione o da questa.
Naturalmente esistono limiti anche notevoli all'applicazione di questo tipo d'inferenze che, di primo acchito, sembrano essere quelle più vicine all'idea intuitiva d'induzione. Il fatto è che all'estrema duttilità delle inferenze di questo tipo fa riscontro l'impossibilità di applicarle, quando la legge che regola il fenomeno sia continua.
Dopo questa rapida elencazione dei grandi tipi d'inferenze statistiche, resta da vedere quale di esse debba essere di volta in volta utilizzata al fine di aumentare le nostre conoscenze sul mondo esterno. La l. i. non è in grado di darci alcuna indicazione a questo proposito. Per ora il compito della l. i. sembra arrestarsi all'individuazione della struttura logica delle inferenze ampliative. Essa non è ancora in grado di darci indicazioni utili alla scelta di uno o l'altro tipo di inferenza. Alcune ricerche recenti, comunque, sembrano legare la scelta di un tipo d'inferenza piuttosto che di un altro al numero delle osservazioni sperimentali disponibili. Ma si tratta d'indicazioni ancora molto parziali.
Bibl.: R. Carnap, Logical foundations of probability, Chicago 1950; B. de Finetti, Teoria della probabilità, Torino 1970; D. Costantini, U. Garibaldi, M.A. Penco, Introduzione alla statistica, Padova 1992.