minimi quadrati a due stadi, metodo dei
Metodo di stima per modelli lineari con endogeneità (➔ endogeno/esogeno), che rientra nella classe dei metodi di stima con variabili strumentali (➔ variabili strumentali, metodo delle). Questo metodo, noto anche come 2SLS (dall’ingl. two-stage least squares), è uno dei più frequentemente utilizzati poiché, sotto particolari condizioni (omoschedasticità, ➔, e incorrelazione degli errori), corrisponde al metodo asintoticamente più efficiente nell’ambito di tale classe. In presenza di endogeneità, cioè di correlazione (➔ covarianza) tra i regressori e gli errori, il metodo dei m. q. (➔ minimi quadrati, metodo dei) produce stimatori inconsistenti del parametro di interesse (➔ consistenza). Tale correlazione può sorgere per diversi motivi: omissione di variabili rilevanti, modelli dinamici con disturbi autocorrelati (➔ autocovarianza), causalità simultanea (➔ causalità), errori di misura nei regressori.
Il metodo 2SLS si utilizza quando il modello include K≥1 regressori endogeni X=(X1,…,XK) e si dispone di R≥K strumenti esogeni validi Z=(Z1,…ZR). Nel caso in cui R=K, cioè nel caso di esatta identificazione, il metodo 2SLS coincide con il metodo semplice di variabili strumentali. Ipotizzando che le osservazioni siano il frutto di campionamento casuale, gli strumenti Z sono validi se: E(ZrU)=0 (esogeneità degli strumenti); la matrice E(ZX′) ha rango pieno di colonna (rilevanza degli strumenti); la matrice E(ZZ′) è finita e non singolare (➔ matrice). Nel caso di un solo regressore endogeno e di un solo strumento (R=K=1), lo strumento è rilevante se è correlato con il regressore endogeno. Si dice che lo strumento è debole se è rilevante ma la sua correlazione con il regressore endogeno è bassa.
Interpretazione del metodo dei minimi quadrati a due stadi. Ci sono due utili interpretazioni dello stimatore 2SLS, corrispondenti a due diversi approcci con cui può essere ottenuto. Si consideri per semplicità il modello di regressione lineare y=α+βX+U, dove X è un regressore endogeno e si dispone di due strumenti validi, Z1 e Z2 (quindi R=2 e K=1). La prima interpretazione, da cui trae origine il nome 2SLS, riflette il fatto che lo stimatore può essere definito tramite una procedura a due stadi. Nel primo stadio si effettua la regressione dei MQO di X su una costante e gli strumenti Z1 e Z2 e si calcolano i valori predetti di X. Poiché i valori predetti di X sono combinazioni lineari degli strumenti esogeni Z1 e Z2 in grandi campioni essi sono esenti da problemi di endogeneità. Nel secondo stadio si effettua la regressione dei MQO di y su una costante e i valori predetti di X ottenuti dal primo stadio. Le stime ottenute da questo secondo stadio sono numericamente uguali a quelle 2SLS. La seconda interpretazione riflette il fatto che lo stimatore 2SLS può anche essere ottenuto da una regressione dei MQO di y su una costante, il regressore endogeno X e il residuo della regressione di primo stadio di X sugli strumenti Z1 e Z2. Il regressore addizionale è a volte chiamato funzione di controllo, e questo secondo approccio è chiamato approccio della funzione di controllo.