CORRELAZIONE
. Biologia. - Ha in biologia significati diversi. Il primo significato è il principio della correlazione delle forme di Cuvier. Secondo questo autore, le parti d'un essere vivente sono legate insieme in tal maniera, che nessuna di esse può cambiare, senza che anche le altre cambino. Perciò, conoscendo alcuni tratti della organizzazione, si possono derivarne gli altri, calcolare quelli che sono con essi compatibili e quelli incompatibili. In queste interrelazioni, alcuni organi hanno maggiori rapporti d'incompatibilità o di coesistenza con altri; sono perciò caratteri dominatori, mentre gli altri sono caratteri subordinati, di vario grado. Queste considerazioni si appoggiano sullo studio dell'organizzazione degli animali; il Cuvier arrivò ad ammettere che vi siano 4 piani di organizzazione fondamentale, e che tutte le forme di organizzazione animale siano da ricondurre a questi, per mezzo di aggiunte, sottrazioni o modificazioni di caratteri. Per Cuvier non esiste alcuna necessaria transizione tra questi 4 tipi fondamentali. Il principio della correlazione ha permesso di ricostruire scheletri di animali estinti, o anche gli animali completi, possedendo resti parziali. Certo questo principio ha reso servigi ed ha un fondamento di verità; tuttavia dal suo autore e dai seguaci di lui è stato esagerato, con la conseguenza di ricostruzioni in parte fantastiche.
Fisiologia. - Nella nomenclatura fisiologica del sistema nervoso centrale il termine correlazione s'applica a quelle combinazioni di impulsi centripeti verificantisi nei centri sensoriali (spinali o encefalici) che effettuano un'integrazione degl'impulsi stessi, tale da poter provocare reazioni motorie appropriate di natura adattativa. In altre parole, i processi svolgentisi nei centri di correlazione (situati nella sezione dorsale o sensitiva dell'asse cerebro-spinale) determinano quale sarà la reazione a un dato gruppo d'impulsi centripeti. Impulsi centripeti provenienti da ricettori diversi agiscono sui centri di correlazione e la reazione che ne segue sarà la risultante dell'azione reciproca che detti impulsi esercitano l'uno sull'altro e sui vestigi fisiologici di precedenti reazioni simili. Quando la scarica nervosa che ne risulta passa nei centri motori e imbocca le rispettive fibre nervose efferenti, che costituiscono quella che Sherrington ha chiamato via finale comune, si ha la reazione determinata dall'o1ganizzazione dei centri motori di coordinazione (v.).
I centri di correlazione hanno un'organizzazione più complessa di quella dei centri di coordinazione; e la maggior parte del tempo che impiegano le reazioni riflesse complicate è occupata dai processi che si svolgono nei centri di correlazione. Il pallio con i suoi giri e i suoi fasci di fibre tese fra i varî lobi di ciascun emisfero cerebrale e íra i due emisferi è un insieme di centri di correlazione; onde si può dire che il grande sviluppo che il sistema nervoso centrale presenta nei Mammiferi superiori e nell'uomo è causato essenzialmente dallo sviluppo di centri di correlazione.
Bibl.: C.J. Herrich, An introduction to Neurology, 3ª ed., Philadelphia e Londra 1922, pp. 36-37.
Statistica. - Nella teoria e nelle applicazioni dei metodi statistici, s'intende per correlazione una forma di relazione tra due variabili empiriche: si dice che tra queste esiste correlazione quando a ciascun valore dell'una corrispondono più valori dell'altra, tali che al variare dell'una l'altra pare variare con una certa regolarità. L'affermazione dell'esistenza d'una correlazione non implica alcuna affermazione sulla natura della relazione tra le due variabili, e tanto meno l'affermazione d'un rapporto di causa ad effetto. Si afferma semplicemente la tendenza di una variabile empirica a variare con approssimazione più o meno grande (con un grado di correlazione più o meno alto) in funzione di un'altra. Talvolta le variazioni dell'una variabile derivano da quelle dell'altra (relazione tra statura del padre e statura del figlio), talvolta sono comuni (relazione tra statura e peso individuale), talvolta reciprocamente dipendenti (relazione tra prezzo e domanda d'una merce: il prezzo influisce a modificare la domanda, la domanda influisce a modificare il prezzo).
Si dice che esiste correlazione tra la statura del figlio (adulto) e quella del padre perché, passando dalle stature più basse alle più alte dei padri, si vede che tendono a crescere le stature dei figli; per la concordanza della variazione si dice che la correlazione è diretta (o positiva). Si dice che esiste correlazione tra la produzione del grano e il suo prezzo perché, passando dalle annate di produzione inferiore alla normale a quelle di produzione superiore alla normale, si vede che tende a decrescere il prezzo del grano; per la discordanza delle variazioni si dice che la correlazione è inversa (o negativa). Correlazione diretta e correlazione inversa costituiscono casi particolari, poiché può darsi che al crescere dell'una variabile l'altra prima tenda a diminuire, poi tenda ad aumentare (come avviene del costo unitario di produzione d'un manufatto, al crescere della quantità prodotta), o viceversa; e possono presentarsi relazioni assai più complicate.
La più stretta relazione possibile tra le due variabili empiriche si ha quando a ciascun dato valore dell'una corrisponde sempre un medesimo valore dell'altra; nell'esempio succitato la massima possibile correlazione si avrebbe se a ciascuna statura del padre corrispondesse sempre una stessa statura del figlio (non necessariamente coincidente con quella del padre). In questa ipotesi la statura del figlio sarebbe rigorosamente funzione della statura del padre e risulterebbe perfettamente determinata quando, stabilita la forma e l'espressione di tale funzione, fosse data la statura del padre.
L'assenza d'ogni relazione fra le due variabili empiriche si ha quando a qualsiasi valore dell'una tende a corrispondere il medesimo assortimento di valori dell'altra; così si avrebbe assenza di correlazione, nel solito esempio, se a qualsiasi statura del padre corrispondesse la medesima distribuzione delle stature del figli.
Tra la correlazione completa, che significa relazione funzionale, e l'assenza di correlazione, che significa mancanza d'ogni relazione si possono avere infinite gradazioni intermedie, nelle quali una funzione rappresenta con approssimazione di mano in mano decrescente la relazione fra le due variabili empiriche. Perciò si concepisce come sia sorta l'idea di misurare il grado della correlazione, attribuendo indice 0 al caso di assenza di correlazione, indice 1 al caso di correlazione completa, indici intermedî fra 0 e 1 ai casi intermedî fra codesti estremi. Per distinguere la correlazione diretta dall'inversa si cerca di ottenere indici positivi per l'una, negativi per l'altra.
Computata la media aritmetica dei valori della variabile empirica che si considera dipendente, corrispondenti a ciascun valore della variabile che si considera indipendente, la successione di tali medie si può assumere a rappresentare una successione di valori, empiricamente determinati, della funzione che indicherebbe la relazione fra le due variabili nell'ipotesi di correlazione completa. Computata, per esempio, la media aritmetica delle stature dei figli, corrispondenti a ciascuna statura del padre, la successione di tali medie offre una rappresentazione della statura del figlio in funzione della statura del padre. Le deviazioni delle medie stesse dalla media aritmetica generale delle stature dei figli misurano l'influenza della statura del padre sulla statura del figlio: se tale influenza fosse nulla, tutte le deviazioni si annullerebbero, perché a qualsiasi statura del padre corrisponderebbe la stessa statura media dei figli; si può dire pertanto che tali deviazioni misurano la dipendenza della variabile "statura del figlio" dalla variabile "statura del padre": per brevità le chiameremo "deviazioni dipendenti". Le deviazioni delle singole stature dei figli di padri d'una data statura dalla statura media dei figli corrispondenti a padri di quella statura, misurano invece l'influenza, sulla statura del figlio, di tutte le circostanze indipendenti dalla statura del padre; se quest'influenza fosse nulla, tutte le deviazioni si annullerebbero, perché a ciascuna statura del padre corrisponderebbe una stessa misura delle stature dei figli; si può dire pertanto che tali deviazioni misurano la dipendenza della variabile "statura del figlio" da circostanze diverse e indipendenti dalla statura del padre: per brevità le chiameremo "deviazioni indipendenti". Le deviazioni, infine, delle singole stature dei figli dalla statura media generale dei figli, sono le somme algebriche delle deviazioni dipendenti e di quelle indipendenti: le diremo perciò "deviazioni risultanti" esse si annullano soltanto se tutte le stature dei figli sono uguali fra loro, se cioè la statura del figlio non risente l'influenza della statura del padre né di altre circostanze, ma costituisce una costante in senso assoluto.
Per misurare il grado della correlazione, o dipendenza, si possono usare varî procedimenti, tutti fondati - esplicitamente o implicitamente - sulle assunzioni ora esposte. Si può istituire un rapporto tra una media dei valori assoluti delle deviazioni dipendenti e una media dei valori assoluti delle deviazioni risultanti: questo rapporto si annulla, con l'annullarsi del numeratore, nel caso di assenza di correlazione; diviene uguale all'unità, con l'uguagliarsi del numeratore al denominatore, nel caso di correlazione completa. Una misura fondata su tale criterio è il "rapporto di correlazione" (correlation ratio) di Pearson, per la formazione del quale si adoperano medie quadratiche delle deviazioni.
Si possono calcolare con criterio parallelo misure del grado di correlazione, o di indipendenza, mettendo in rapporto una media dei valori assoluti delle variazioni indipendenti con una media dei valori assoluti delle variazioni risultanti; i risultati concordano coi precedenti soltanto nei casi estremi, discordando nei casi intermedî, nei quali la somma del rapporto indice del grado di dipendenza e del rapporto indice del grado di indipendenza riesce sempre superiore all'unità, invece che uguale ad 1, come dovrebbe riuscire alfinché i due indici fossero compatibili e concordanti. Per evitare tale discordanza, conviene misurare il grado di dipendenza e il grado dì indipendenza mediante rapporti aventi gli stessi numeratori di quelli ora descritti, ma aventi invece come comune denominatore la somma dei due numeratori; questi rapporti hanno sempre per somma l'unità, e quindi concordano nelle loro indicazioni: se, p. es., l'indice del grado di dipendenza risulta 0,86, quello del grado di indipendenza risulta 0,14.
Invece di assumere la successione delle medie delle stature dei figli corrispondenti alle singole stature dei padri a rappresentare la statura del figlio in funzione della statura del padre, si può ricercare un'espressione di tale funzione mediante procedimenti interpolatori. Se ci si limita ad interpolare, col metodo dei minimi quadrati, una funzione lineare, le deviazioni dei valori interpolati dalla media generale misurano le "deviazioni dipendenti" nel senso dianzi convenuto, le deviazioni dei valori osservati dai valori interpolati misurano le "deviazioni indipendenti". Partendo da tali deviazioni, si possono determinare misure del grado di dipendenza coi due criterî spiegati sopra. Col primo criterio, e adoperando medie quadratiche delle deviazioni dipendenti e delle deviazioni risultanti, si ottiene il "coefficiente di correlazione" di Bravais, largamente usato dagli statistici, non sempre a proposito. Esso presenta un inconveniente analogo a quello del rapporto di correlazione, poiché le sue indicazioni non concordano con quelle di un "coefficiente di non correlazione" ottenuto con procedimento parallelo dal rapporto fra deviazioni indipendenti e deviazioni risultanti. Si rimedia ricorrendo a un criterio analogo a quello applicato dianzi.
Non v'è ragione, in generale, di fermarsi all'interpolazione lineare, e perciò le misure del grado di dipendenza, o di correlazione, si possono moltiplicare indefinitamente, come indefinitamente si possono variare le funzioni interpolatrici. Tuttavia, se si adopera il metodo dei minimi quadrati, la misura del grado di dipendenza varia tra un minimo corrispondente al caso d'interpolazione lineare e un massimo corrispondente al caso d'interpolazione di una funzione che assuma per ciascun valore della variabile indipendente il valore della media aritmetica dei corrispondenti valori della variabile dipendente. Perciò il coefficiente di correlazione e il rapporto di correlazione, e gli analoghi rapporti determinati col secondo criterio precedentemente esposto, hanno speciale importanza, rappresentando i limiti fra i quali variano le misure dei gradi di dipendenza, o di correlazione, comunque varii la forma di relazione funzionale supposta fra le due variabili.
Si può anche procedere nello studio della correlazione per una via apparentemente diversa, riguardando il numero dei casi in cui si presenta ciascuna combinazione di valori delle due variabili come funzione di entrambe le variabili stesse; per esempio, il numero di casi corrispondente ad una certa combinazione della statura del figlio con la statura del padre come funzione ad un tempo della statura del padre e di quella del figlio. Allora la correlazione viene espressa da una funzione di due variabili; in certe ipotesi il coefficiente di correlazione è un parametro caratteristico di tal funzione ed è adatto - con le riserve già esposte - a indicare il grado della correlazione. Ma nella maggior parte delle applicazioni ai fenomeni sociali questa forma d'analisi della correlazione non trova utile impiego perché le ipotesi su cui si fonda non hanno riscontro nella realtà, e riesce più conveniente l'altra forma prima spiegata. Si può estendere il concetto di correlazione al caso di tre o più variabili: per esempio alla relazione tra la statura del figlio, quella del padre e quella della madre. Si ottengono allora indici del grado di correlazione totale, quando si misura il grado di dipendenza di una variabile da tutte le altre simultaneamente considerate; indici del grado di correlazione parziale, quando si misura il grado di dipendenza d'una variabile da una delle altre, tenendo però cont0 della relazione esistente con le rimanenti.
Bibl.: K. Pearson, On the general theory of skew correlation and non-linear regression, Londra 1905; G.U. Yule, On the theory of correlation, in Journal of the Royal Statistical Society, 1897, p. 812; A.A. Tschuprow, Grundbegriffe und Grundprobleme der Korrelationstheorie, Lipsia 1925; A.L. Bowley, Elements of statistics, 5ª ediz., Londra 1926; G.U. Yule, An introduction to the theory of statistics, 8ª ediz., Londra 1927; R. Benini, Principî di statistica metodologica, Torino 1905; C. Gini, Appunti di statistica, Padova 1915; G. Mortara, Lezioni di statistica metodologica, Città di Castello 1922. Vedi anche F. Vinci, Sulla misura della concordanza tra caratteri quantitativi, Roma 1918.
Per correlazione in geometria, v. geometria.