11.6 Consideraciones adicionales sobre la estimación de la varianza de los estimadores de muestreo

En la práctica del muestreo, existen algunos paradigmas que inducen la planeación y diseño de las encuestas. En esta sección se muestran ejemplos y contra-ejemplos que permiten ilustrar algunas mitos en la estimación del error de muestreo de las encuestas de hogares. Para esto, consideremos la varianza del esimador HT, dada a continuación:

\[ Var(\hat{t}_{y, \pi})= \sum_{k\in U}\sum_{l\in U} \Delta_{kl}\frac{y_k}{\pi_k}\frac{y_l}{\pi_l} \]

En donde \(\Delta_{kl} = (\pi_{kl}-\pi_k\pi_l)\) y \(\pi_{kl}\) denota la probabilidad de inclusión conjunta de los elementos \(k\) y \(l\) pertenezcan a la muestra \(s\). Bajo diseños de muestreo de tamaño fijo, existen dos estimadores insesgados para esta varianza, el primero originalmente propuesto por Horvitz y Thompson (1952) y dado por

\[ \widehat{Var}_1(\hat{t}_{y, \pi})= \sum_{k\in s}\sum_{l\in s} \frac{\Delta_{kl}}{\pi_{kl}}\frac{y_k}{\pi_k}\frac{y_l}{\pi_l} \]

El segundo estimador propuesto por Sen (1953) y Yates y Grundy (1953), está dado por la siguiente expresión:

\[ \widehat{Var}_2(\hat{t}_{y, \pi})=-\frac{1}{2} \sum_{k\in s}\sum_{l\in s} \frac{\Delta_{kl}}{\pi_{kl}}\left(\frac{y_k}{\pi_k}-\frac{y_l}{\pi_l}\right)^2 \]

11.6.1 Estimaciones negativas de varianza

La idea de que no pueden existir estimaciones negativas de la varianza se ha instalado como un razonamiento bastante lógico e intuitivo: dado que la varianza es un parámetro positivo, entonces no puede ser estimada con cantidades negativas. Sin embargo, en la inferencia basada en el diseño de muestreo, sí es posible obtener estimativas negativas de varianza para algunas estructuras poblacionales particulares y es por esto que se requiere una experiencia mayor por parte del equipo de muestreo, que debe conocer bajo qué condiciones se podría presentar esta situación para evadirla.

Nótese que se debe diferenciar entre estimador (que es una función de variables aleatorias) y parámetro (que es un valor real desconocido). En efecto, para la varianza del estimador HT (parámetro desconocido y siempre positivo) hay estimadores (función de variables aleatorias) que pueden arrojar estimaciones negativas. Es posible que las estimaciones de la varianza arrojen resultados negativos, que no pueden ser utilizados ni interpretados. Considere el siguiente diseño de muestreo de tamaño fijo e igual a \(n=2\), el cual induce seis posibles muestras.

\(s\) \(I_1\) \(I_2\) \(I_3\) \(I_4\) \(p(s)\)
\(s_1\) 1 1 0 0 0.31
\(s_2\) 1 0 1 0 0.20
\(s_3\) 1 0 0 1 0.14
\(s_4\) 0 1 1 0 0.03
\(s_5\) 0 1 0 1 0.01
\(s_6\) 0 0 1 1 0.31

En el anterior ejemplo, la probabilidad de obtener una muestra compuesta por los dos primeros elementos se fijó en 0.31; mientras que la probabilidad de obtener una muestra compuesta por el primer y el tercer elemento se fijó en 0.20 y así sucesivamente. Para esta configuración se obtienen las estimaciones puntuales para cada una de las seis posibles muestras, así como las dos posibles estimaciones de la varianza. Nótese que para ambos escenarios existen estimaciones negativas.

\(s\) \(I_1\) \(I_2\) \(I_3\) \(I_4\) \(p(s)\) \(\hat{t}_{y, \pi}\) \(\widehat{Var}_1(\hat{t}_{y, \pi})\) \(\widehat{Var}_2(\hat{t}_{y, \pi})\)
\(s_1\) 1 1 0 0 0.31 9.560440 38.099984 -0.9287681
\(s_2\) 1 0 1 0 0.20 5.883191 -4.744190 2.4710422
\(s_3\) 1 0 0 1 0.14 4.933110 -3.680428 8.6463858
\(s_4\) 0 1 1 0 0.03 7.751323 -100.252974 71.6674365
\(s_5\) 0 1 0 1 0.01 6.801242 -165.715154 323.3238494
\(s_6\) 0 0 1 1 0.31 3.123994 3.426730 -0.1793659

A pesar de los resultados negativos para las varianzas, tanto el estimador del total como los dos estimadores de su varianza siguen siendo insesgados. En efecto al multiplicar la estimación puntual por la probabilidad del diseño de muestreo se obtienen los valores poblacionales. La varianza del estimador HT para este diseño en particular es 6.744442, la cual corresponde con la esperanza de ambos estimadores de varianza. Para evitar estas estimativas negativas, H. A. Gutiérrez (2016) afirma que es necesario garantizar que la covarianza (\(\Delta_{kl}\)) sea negativa para cada par de elementos en la población (\(k \neq l\)), lo cual no sucede con este esquema de muestreo, puesto que:

\[ \Delta_{kl} = \begin{bmatrix} 0.2275 & 0.0825 & -0.1510 & -0.1590 \\ 0.0825 & 0.2275 & -0.1590 & -0.1510 \\ -0.1510 & -0.1590 & 0.2484 & 0.0616 \\ -0.1590 & -0.1510 & 0.0616 & 0.2484 \end{bmatrix} \]

11.6.2 Disminución de la varianza ante el aumento del tamaño de muestra

Por otro lado, la idea de que al aumentar el tamaño de la muestra debería disminuir la varianza deriva de la lógica intuitiva en donde el error de muestreo no debería existir si se realiza una medición completa de la población. Sin embargo, aunque esto es lo que por lo general ocurre, hay algunas excepciones. Luego, para algunas estrategias de muestreo es posible encontrar que existen situaciones en donde el tamaño de muestra crece, y con él la varianza del estimador. En esta sección se mostrará un ejemplo en donde sucede exactamente eso.

Para poder mostrar este hecho, vamos a utilizar un ejemplo reducido. Supongamos una población de \(N = 3\) elementos \(U=\{1, 2, 3\}\) y comparemos dos diseños de muestreo, el primero con un tamaño de muestra fijo de \(n=1\) y el segundo con un tamaño de muestra fijo de \(n=2\). En ambos casos la variable de interés es dicotómica que denota la presencia o ausencia del fenómeno en los individuos de la población. En el primer caso, el diseño de muestreo de tamaño de muestra \(n=1\) es el siguiente:

\(s\) \(I_1\) \(I_2\) \(I_3\) \(p(s)\)
\(s_1\) 1 0 0 0.5
\(s_2\) 0 1 0 0.1
\(s_3\) 0 0 1 0.4

En este esquema de muestreo, la varianza del estimador de Horvitz-Thompson es igual a \(Var(\hat t_{y, \pi}) = 1.5\). Sin embargo, en un segundo caso, considere el siguiente diseño de muestreo de tamaño de muestra \(n=2\):

\(s\) \(I_1\) \(I_2\) \(I_3\) \(p(s)\)
\(s_1\) 1 1 0 0.7
\(s_2\) 1 0 1 0.2
\(s_3\) 0 1 1 0.1

Nótese que en este esquema de muestreo, la varianza del estimador de Horvitz-Thompson es igual a \(Var(\hat t_{y, \pi}) = 2.3\). Por tanto, no es exacto afirmar que siempre que un diseño de muestreo contemple un tamaño de muestra más grande se tendrá obligatoriamente una reducción de la varianza.

Referencias

———. 2016. Estrategias de muestreo: diseño de encuestas y estimación de parámetros. Segunda edición. Ediciones de la U.
Horvitz, D. G., y D. J. Thompson. 1952. «A generalization of sampling without replacement from a finite universe». Journal of the American Statistical Association 47: 663-85.
Sen, A. R. 1953. «On the estimate of the variance in sampling with varying probabilities». Journal of the Indian Society of Agricultural Statistics 5: 119-27.
Yates, F., y P. M. Grundy. 1953. «Selection without replacement from within strata with probability proportional to size». Journal of the Royal Statistical Society B 15: 253-61.