gaussiana, distribuzione
Distribuzione di eccezionale rilevanza nel calcolo delle probabilità e in statistica. Una singola variabile aleatoria X si dice distribuita normalmente o con distribuzione normale o g., di parametri m, s, se è dotata per ogni x reale di densità f(x)=(2πs2)−1/2exp[−(x−m)2/2s2]. Si dimostra che il ruolo dei parametri è quello di valore atteso (m), che è anche contemporaneamente moda e mediana della distribuzione, e di scarto quadratico medio o deviazione standard (s). I due parametri sintetizzano dunque, rispettivamente, la tendenza centrale e la dispersione (variabilità) della distribuzione della variabile aleatoria. Geometricamente, la densità è rappresentata da una curva a forma di campana, detta curva g. o curva degli errori, simmetrica rispetto a m, nel cui punto assume il valore massimo (2πs2)−1/2. Essa diviene infinitesima al divergere di x e ha due flessi in corrispondenza dei valori di ascissa m−s e m+s. Intuitivamente, la curva è più diffusa e meno slanciata al crescere di s. Di particolare rilevanza è la distribuzione corrispondente alla coppia di parametri m=0, s=1, ovvero di densità f(x)=(2π)−1/2exp[−(x)2/2]: essa è detta normale standard. Dato il frequente impiego nelle applicazioni della distribuzione normale, sono state costruite tabelle numeriche molto precise, ossia con passo molto ridotto di x, della funzione cumulata, o funzione di ripartizione Z(x)=P(Z≤x) o del suo complemento a 1(P(Z>x)). Le tabelle permettono di valutare la probabilità che una N(m, s) assuma determinazione minore (o maggiore) di un certo valore y. Vale infatti la P(N≤y)=P(Z≤(y−m)/s) e basta fare ricorso alle tavole della cumulata di Z in corrispondenza a x=(y−m)/s. Questa proprietà è utilizzata anche per calcolare le probabilità di scarti assoluti dalla media superiori a multipli della deviazione standard. In particolare, P(|N−m|>s) (o di 2s o di 3s) è circa 0,3173 (o 0,0455 o 0,0027). Ciò significa che la probabilità di scarti dalla media superiori a 2 (3) deviazioni standard è inferiore al 5% (3‰).
La classe delle distribuzioni g. gode di notevoli proprietà. La somma di due o più variabili normali indipendenti è ancora normale con media pari alla somma delle medie e varianza pari alla somma delle varianze. Tende alla g. (ovvero è approssimativamente normale) anche la somma di un numero sufficientemente grande di variabili indipendenti e ugualmente distribuite (anche se non g.) con varianza finita non nulla (teorema di Lindeberg-Levy) e più in generale (teoremi di Liapounoff e di Lindeberg-Feller) la somma di un numero sufficientemente grande di variabili indipendenti, anche se non ugualmente distribuite, a condizione che la varianza di ogni singolo addendo sia trascurabile (tecnicamente converga a zero al divergere della numerosità) rispetto alla somma delle varianze. Questo risultato è di grande rilievo nelle applicazioni assicurative; consente infatti, considerando con qualche disinvoltura fra loro indipendenti i rischi coperti da una compagnia di assicurazioni, di valutare come approssimativamente normale la distribuzione del totale dei sinistri in capo alla compagnia stessa. Distribuzioni normali congiunte riguardano coppie o, più in generale, n-ple di variabili aleatorie. In particolare, la distribuzione di densità congiunta di una coppia (X,Y) di variabili aleatorie è una funzione di 5 parametri; oltre alla coppia di medie e alla coppia di varianze interviene anche il coefficiente di correlazione lineare fra le due variabili. Nelle applicazioni finanziarie risulta di particolare importanza la distribuzione log-normale; essa è quella di una variabile aleatoria il cui logaritmo naturale abbia distribuzione gaussiana. Si considerano, infatti, approssimativamente log-normali le distribuzioni dei prezzi azionari. Di conseguenza, distribuzioni log-normali intervengono nelle formule che danno il prezzo teorico di opzioni su titoli azionari (➔ Black-Scholes, formula di).