1. Econometría
Unidad 4. Problemas Econométricos
Fernando Gonzales Fernández
(POSIBLES) MEDIDAS INDIRECTAS PARA
MITIGAR LA MULTICOLINEALIDAD
2. (1) Combinar variables correlacionadas.
1
En esta presentación, examinamos cuatro posibles métodos indirectos para aliviar la
multicolinealidad.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
3. 2
En primer lugar, si las variables correlacionadas son similares conceptualmente, puede ser
razonable combinarlas en algún índice global.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(1) Combinar variables correlacionadas.
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
4. 3
Eso es precisamente lo que se ha hecho con las tres variables cognitivas del ASVAB. El
ASVABC ha sido calculado como un promedio ponderado de las puntuaciones de los
subtests: ASVABAR (razonamiento aritmético), ASVABWK (conocimiento de palabras) y
ASVABPC (comprensión de párrafos).
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
5. 4
Los tres componentes están muy correlacionados y al combinarlos como un promedio
ponderado, en lugar de utilizarlos individualmente, se evita un posible problema de
multicolinealidad.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
6. (2) Elimine algunas de las variables correlacionadas.
5
La eliminación de algunas de las variables correlacionadas, si tienen coeficientes no
significativos, puede aliviar la multicolinealidad.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
7. 6
Sin embargo, este enfoque de la multicolinealidad es peligroso. Es posible que algunas de
las variables con coeficientes no significativos realmente pertenezcan al modelo y que la
única razón por la que sus coeficientes sean no significativos sea porque existe un
problema de multicolinealidad.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(2) Elimine algunas de las variables correlacionadas.
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
8. 7
Si ese es el caso, su eliminación puede causar el "sesgo de la variable omitida", que se
discutirá más adelante
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(2) Elimine algunas de las variables correlacionadas.
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
9. 8
Otra forma de abordar el problema de la multicolinealidad es utilizar información externa, si
se dispone de ella, relativa al coeficiente de una de las variables.
(3) Restricción empírica
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
u
P
X
Y
3
2
1
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
10. 9
Por ejemplo, supongamos que Y en es la demanda de una categoría de gastos de consumo,
X es la renta personal disponible agregada y P es un índice de precios de la categoría.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
u
P
X
Y
3
2
1
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
11. 10
Para ajustar un modelo de este tipo se utilizan datos de series temporales. Si X y P están
altamente correlacionados, lo que suele ocurrir con las variables de series temporales, el
problema de la multicolinealidad podría eliminarse de la siguiente manera.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
u
P
X
Y
3
2
1
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
12. 11
Obtener datos sobre ingresos y gastos a partir de una encuesta de hogares y hacer una
regresión de Y' en X'. (Las marcas ' son para indicar que los datos son datos de hogares, no
datos agregados).
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
u
P
X
Y
3
2
1
u
X
Y
'
'
2
'
1
'
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
' ' ' '
1 2
ˆ ˆ
Ŷ X
13. 12
Se trata de una regresión simple porque habrá relativamente poca variación en el precio
pagado por los hogares.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
u
P
X
Y
3
2
1
u
X
Y
'
'
2
'
1
'
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
' ' ' '
1 2
ˆ ˆ
Ŷ X
14. 13
Sustituya por 2 en el modelo de series temporales. Reste X de ambos lados, y haga la
regression Z = Y – X en el precio. Esta es una regresión simple, por lo que la
multicolinealidad ha sido eliminada
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
u
P
X
Y
3
2
1
u
X
Y
'
'
2
'
1
'
' ' ' '
1 2
ˆ ˆ
Ŷ X
'
1 2 3
ˆ
Y X P u
'
2 1 2
ˆ
Z Y X P u
'
2
̂
'
2
̂ '
2
̂
15. 14
Hay algunos problemas con esta técnica. En primer lugar, los coeficientes 2 pueden ser
conceptualmente diferentes en series temporales y de corte transversal.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
u
P
X
Y
3
2
1
u
X
Y
'
'
2
'
1
'
' ' ' '
1 2
ˆ ˆ
Ŷ X
'
1 2 3
ˆ
Y X P u
'
2 1 2
ˆ
Z Y X P u
16. u
P
X
Y
3
2
1
15
En segundo lugar, como restamos el componente de ingreso estimado X, y no el
componente de ingreso real 2X, de Y al construir Z, hemos introducido un elemento de
error de medición en la variable dependiente.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(3) Restricción empírica
u
X
Y
'
'
2
'
1
'
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
' ' ' '
1 2
ˆ ˆ
Ŷ X
'
1 2 3
ˆ
Y X P u
'
2 1 2
ˆ
Z Y X P u
'
2
̂
17. 16
El último método indirecto, aunque no el menos importante, para aliviar la multicolinealidad
es el uso de una restricción teórica, que se define como una relación hipotética entre los
parámetros de un modelo de regresión.
(4) Restricción teórica
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
18. 17
Se explicará utilizando como ejemplo un modelo de logros educativos básicos.
Supongamos que tenemos la hipótesis de que el grado más alto completado, S, depende
del ASVABC, y el grado más alto completado por la madre y el padre del encuestado, SM y
SF, respectivamente.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(4) Restricción teórica
u
SF
SM
ASVABC
S
4
3
2
1
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
19. 18
S aumenta en 0,09 años por cada año extra de escolaridad de la madre y 0,20 años por cada
año extra de escolaridad del padre.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
20. 19
En general, se considera que la educación de la madre es al menos, si no más, importante
que la del padre para el logro educativo, por lo que este resultado es inesperado.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
21. 20
Sin embargo, el emparejamiento fortuito lleva a una correlación entre SM y SF y la
regresión puede estar sufriendo de multicolinealidad. Esto podría conducir a estimaciones
erráticas de los coeficientes.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
. cor SM SF
(obs=500)
| SM SF
--------+------------------
SM | 1.0000
SF | 0.5312 1.0000
22. 21
Supongamos que tenemos la hipótesis de que la educación de la madre y del padre son
igualmente importantes. Entonces podemos imponer la restricción 3 = 4.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(4) Restricción teórica
u
SF
SM
ASVABC
S
4
3
2
1
4
3
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
23. 22
Esto nos permite reescribir la ecuación como se muestra.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(4) Restricción teórica
u
SF
SM
ASVABC
S
4
3
2
1
4
3
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
1 2 3
1 2 3
S ASVABC SM SF u
ASVABC SP u
24. u
SF
SM
ASVABC
S
4
3
2
1
4
3
23
Definiendo SP como la suma de SM y SF, la ecuación puede ser reescrita como se muestra.
El problema causado por la correlación entre SM y SF ha sido eliminado.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
(4) Restricción teórica
2
2 3 2 3
2 2
2
ˆ 2 2 2
, 2 ,
2 2
1 1
1 MSD 1
u u
X X X X
i
r n X r
X X
1 2 3
1 2 3
S ASVABC SM SF u
ASVABC SP u
25. . g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 120.22
Model | 1223.98508 2 611.992542 Prob > F = 0.0000
Residual | 2530.03692 497 5.09061754 R-squared = 0.3260
-----------+------------------------------ Adj R-squared = 0.3233
Total | 3754.022 499 7.52309018 Root MSE = 2.2562
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------
24
La estimacipon de 3 es ahora 0.150.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
26. . g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------
25
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
No es sorprendente que se trate de una solución de compromiso entre los coeficientes de
SM y SF de la especificación anterior.
. reg S ASVABC SM SF
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
27. 26
El error estándar de SP es mucho más pequeño que los de SM y SF. El uso de la restricción
ha llevado a una gran ganancia en eficiencia y el problema de la multicolinealidad ha sido
eliminado.
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------
. reg S ASVABC SM SF
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------
28. 27
La estadística t es muy alta. Por lo tanto, parece que la imposición de la restricción ha
mejorado los resultados de la regresión. Sin embargo, es posible que la restricción no sea
válida. Deberíamos probarla. (lo haremos en los siguientes temas)
MEDIDAS INDIRECTAS PARA MITIGAR LA MULTICOLINEALIDAD
. g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------
. reg S ASVABC SM SF
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------