chi quadro, test
Qualsiasi test per la verifica di un’ipotesi statistica (➔ ipotesi statistica), la cui distribuzione campionaria, sotto l’ipotesi nulla, segua una distribuzione c. q. (➔ distribuzione di probabilità), seppure solo asintoticamente. In genere, tali test possono essere rappresentati sotto forma di divergenza tra la distribuzione determinata dal campione osservato e la distribuzione teorica, ossia quella definita dal modello statistico utilizzato. A causa della presenza di variabilità campionaria, infatti, la frequenza con cui un particolare evento viene osservato non coincide necessariamente con la probabilità teorica di quell’evento.
In genere, quando si parla di test del c. q. in senso stretto si intende il test della bontà di adattamento ideato da Pearson, test non-parametrico per verificare che il campione osservato non contraddica la distribuzione teorica. Rientrano in questa categoria il test di indipendenza di due variabili aleatorie, o la verifica dell’ipotesi di simmetria di una distribuzione. Più precisamente, si consideri un campione di N osservazioni, ciascuna delle quali può appartenere a uno solo di k insiemi, o modalità, con probabilità πi, per 1≤ i≤ k. Le probabilità πi sommano a 1 e rappresentano la distribuzione di probabilità teorica, della quale si vuole verificare la veridicità, sulla base del campione osservato. In corrispondenza di questo, ciascuna frequenza Ni misura il numero di osservazioni che ‘cadono’ nell’i-esimo insieme, dove ∑i Ni=N. Ci si aspetta che le frequenze relative p=(N1/N,...,Nk/N) descrivano una distribuzione di probabilità che, pur non coincidendo in generale con la probabilità teorica π=(π1,...,πk), sarà tanto più vicina a essa quanto maggiore è la dimensione del campione.
La statistica test del c. q. è basata sulla seguente misura di divergenza tra le due distribuzioni p e π :χ2(p,π)=Ʃi(pi−πi)2/πi, detta divergenza del chi-quadro. La divergenza χ2 è, per definizione, una quantità non negativa ed è uguale a zero solo se p e π coincidono. A differenza di una comune distanza, però, la divergenza non è simmetrica, ossia χ2(p,π)≠χ2(π,p). Sotto l’ipotesi nulla che π descriva effettivamente il vettore delle probabilità, per i k eventi, la statistica Nχ2 si distribuisce approssimativamente come una variabile aleatoria c. q. con k−1 gradi di libertà. È possibile anche basare il test sulla divergenza χ2(π,p). In tal caso, la statistica test è generalmente indicata con il nome di test di bontà di adattamento di Pearson modificato. Per conoscere i valori critici di χ2, a un determinato livello di significatività e con gli opportuni gradi di libertà, ci si può avvalere di tabelle.
Oltre al test del c. q. di Pearson, si può ricordare il test del c. q. di Yates, ovvero la correzione proposta da F. Yates per la continuità, o i test basati sulla verosimiglianza, che fanno ricorso alla variabile c. q. come distribuzione approssimativa.