7.4 Otras consideraciones

7.4.1 El efecto de diseño en subpoblaciones

La estimación del efecto de diseño es un problema común cuando se trabaja con estimaciones desagregadas en subpoblaciones de interés. Por un lado, cuando las subpoblaciones constituyen estratos (o agregaciones de estratos) planeados de antemano, para los cuales se conoce previamente su tamaño poblacional, se tiene el siguiente efecto de diseño:

\[ DEFF_h= \frac{Var (\hat\theta_h) }{Var_{MAS}^h(\hat\theta_h) } \]

En donde \(Var_{MAS}^h(\hat\theta_h)\) es la varianza del estimador restringida al estrato \(h (h=1,\ldots, H)\); en el caso en el que \(\hat\theta_h\) corresponda al estimador del promedio poblacional en el estrato \(h\), su valor es el siguiente:

\[ Var_{MAS}^h(\hat\theta_h)=\frac{1}{n_h}\left(1-\frac{n_h}{N_h}\right)S^2_{y_{U_h}} \]

Siendo \(n_h\) el tamaño de la muestra en el estrato \(h\), \(N_h\) el tamaño poblacional del estrato \(h\) y \(S^2_{y_{U_h}}\) es la varianza poblacional de la variable de interés restringida al subgrupo \(h\). Por lo tanto, los efectos de diseño para las medias muestrales en un diseño aleatorio estratificado, serán por definición iguales a uno.

Por otro lado, cuando la subpoblación de interés no es un estrato o un post-estrato sino un subgrupo aleatorio (como por ejemplo las personas pobres, las personas ocupadas, o cualquier otro subgrupo no planeado en el diseño de la encuesta o en la etapa de calibración), en adelante notado con la letra \(g\), cuyo tamaño de muestra no es fijo (o condicionalmente fijo por la calibración) sino aleatorio, entonces la estimación correcta del efecto de diseño es la siguiente:

\[ DEFF_g = \frac{Var (\hat\theta_g) }{Var_{MAS}^U(\hat\theta_g) } \]

En donde \(Var_{MAS}^U(\hat\theta_g)\) es la varianza del estimador de interés. En el caso en el que \(\hat\theta_g\) corresponda al estimador del promedio poblacional en el subgrupo \(g\), entonces su varianza estaría dada por la siguiente expresión:

\[ Var_{MAS}^U(\hat\theta_g)=\frac{1}{n}\left(1-\frac{n}{N}\right)S^2_{y_{gU}} \]

En donde \(S^2_{y_{gU}}\) es la varianza poblacional de una nueva variable calculada en toda la población, que toma el valor de \(y_k\), cuando la unidad \(k\) pertence al subgrupo \(g\), y toma el valor de cero, en cualquier otro caso. Por lo tanto, en ambos efectos de diseño, la estimación de la varianza del diseño de muestreo complejo \(Var (\hat\theta_h)\) o \(Var (\hat\theta_g)\) es la misma, pero el denominador cambia dependiendo de si el subgrupo es un estrato o no. Es por esta razón que, al analizar una encuesta de hogares, hay coincidencia en las cifras relacionadas con la estimación puntual, errores estándar, intervalos de confianza y coeficientes de variación entre los diferentes softwares computacionales. Sin embargo, es necesario percatarse de las opciones que estos adjuntan para calcular correctamente la cifra apropiada. Nótese que, en resumen, las estimaciones de \(Var_{MAS}^U(\hat\theta_g)\) y \(Var_{MAS}^h(\hat\theta_h)\) serán diferentes, puesto que la primera involucra a toda la muestra, mientras que la segunda involucra únicamente a la muestra del estrato.

Lumley (2010) afirma que el efecto del diseño compara la varianza de una media o total con la varianza de un estudio del mismo tamaño utilizando un muestreo aleatorio simple sin reemplazo y que su cálculo será incorrecto si los pesos de muestreo se han re-escalado o no son recíprocos a las probabilidades de inclusión. Por ejemplo, en el caso de las subpoblaciones, la librería survey de R compara la varianza de la estimación con la varianza de una estimación basada en una muestra aleatoria simple del mismo tamaño que el de la subpoblación. Entonces, por ejemplo, en el muestreo aleatorio estratificado, el efecto de diseño calculado en un estrato será igual a uno.

7.4.2 El efecto de diseño general

Suponga que el diseño muestral es estratificado con \(H\) estratos; entonces por la independencia de la selección en los estratos, la varianza del estimador de un total poblacional \(t_y\) está dada por

\[ Var\left(\widehat{t_{y,\pi}}\right)=\sum_{h=1}^{H}Var_h\left(\widehat{t_{y,\pi}}\right) \]

donde

\[ {Var}_h\left(\widehat{t_{y,\pi}}\right)={DEFF}_h \times {Var}_{MAS,h}\left(\widehat{t_{y,\pi}}\right) \]

Por otro lado,

\[ Var\left(\widehat{t_{y,\pi}}\right)=DEFF \times {Var}_{MAS}\left(\widehat{t_{y,\pi}}\right) \]

De esta forma, se tiene que

\[ DEFF=\frac{\sum_{h=1}^{H}DEFF_h{Var}_{MAS,h}\left(\widehat{t_{y,\pi}}\right)}{Var_{MAS}\left(\widehat{t_{y,\pi}}\right)}=\frac{\sum_{h=1}^{H}DEFF_h\frac{N_h^2}{n_h}(1-\frac{n_h}{N_h})S_{y,U_h}^2}{\frac{N^2}{n}(1-\frac{n}{N})S_{y,U}^2} \]

Es decir, el efecto de diseño puede ser visto como una combinación lineal de los efectos de diseño de los \(H\) estratos \((DEFF=\sum_{h=1}^{H} DEFF_h \ w_h)\). En donde el peso \(w_h\) está dado por

\[ w_h=\frac{\frac{N_h^2}{n_h}(1-\frac{n_h}{N_h})S_{y,U_h}^2}{\frac{N^2}{n}(1-\frac{n}{N})S_{y,U}^2} \]

Es claro que los pesos \(w_h\) son todos positivos, pero no necesariamente son menores a 1, y la suma de ellos tampoco es igual a 1. A continuación, examinamos la forma de \(w_h\) en el caso especial de muestras autoponderadas en todos los estratos. En este caso, se tiene que \(\frac{n_h}{N_h}=\frac{n}{N}\) para todo \(h=1,\ldots,H\), y se puede ver que

\[ w_h=\frac{N_hS_{y,U_h}^2}{NS_{y,U}^2}=\frac{\sum_{U_h}{(y_k-{\bar{y}}_{U_h})}^2}{\sum_{U}{(y_k-{\bar{y}}_U)}^2} \]

Aunque \(\sum_{h=1}^{H}w_h\neq 1\), el peso del estrato \(h\) sí tiene una interpretación interesante, pues queda definido como la suma de cuadrados dentro del estrato, dividido por la suma de cuadrados totales de la variable de interés. Y podemos concluir que cuando los estratos están bien construidos, esto es, la variable de interés es homogénea dentro de cada estrato y los diferentes estratos son heterogéneos entre sí, los pesos \(w_h\) serán muy pequeños y el \(DEFF\) general resultará mucho más pequeño que los \(DEFF\) de los estratos.

Por otro lado, si los estratos no fueron construidos teniendo en cuenta la variabilidad de la característica de interés, entonces \(S_{y,U_h}^2\approx S_{y,U}^2\) y \(w_h=N_h/N\). De esta forma, la suma de los pesos es igual a 1, y se puede concluir que el \(DEFF\) del diseño general es un promedio ponderado de los efectos de los \(H\) estratos, y el estrato que tiene mayor peso será aquel que tiene mayor representación del universo.

Finalmente, alguno de los pesos \(w_h\) puede resultar ser mayor a 1 cuando para algún estrato \(\frac{n_h}{N_h}\neq\frac{n}{N}\), y cuando los estratos no están bien construidos.

7.4.3 El efecto de diseño en las encuestas de hogares de la región

En general, para las encuestas de hogares en la región, se planean esquemas de estratificación, aglomeración y selección de UPM con probabilidades desiguales. Heeringa, West, y Berglund (2017) anotan que el efecto de estratificación reduce la varianza de las estrategias de muestreo, mientras que el efecto de selección desigual tiende a aumentarla. En general, estos dos efectos tienden a anularse entre sí. Por lo tanto, el efecto de diseño de una encuesta compleja estará únicamente en función del efecto de aglomeración, el cual puede llegar a ser grande, en comparación con los otros dos. Como ya se había comentado antes, la expresión generalizada que da cuenta del efecto de aglomeración en los diseños de muestreo complejos de las encuestas de hogares es la siguiente:

\[ DEFF \approx 1 + (\bar{n}_{II} - 1)\rho_y \]

En donde se recalca que \(\bar{n}_{II}\) representa el número promedio de hogares seleccionados dentro de cada UPM y \(\rho_y\) es el coeficiente de correlación intraclase, que representa el grado de homogeneidad de la variable de interés dentro de cada hogar.

Este efecto cambiará dependiendo de si la inferencia de la encuesta de hogares se quiere realizar a nivel nacional o a nivel regional. Por ejemplo, UN (2005, cap. 7) presenta el comportamiento de esta medida a lo largo de tres encuestas de hogares en Brasil: la Pesquisa Nacional por Amostra de Domicílios (PNAD), la Pesquisa Mensal de Emprego (PME) y la Pesquisa de Padrões de Vida (PPV). En general, estas encuestas utilizan estratificación y selección de UPM con probabilidades desiguales; además, el tamaño promedio de las UPM es de 250 viviendas, de las cuales son seleccionadas 13 por la PNAD, 20 en la PME y 16 y 8 viviendas en la PPV en la zona rural y urbana, respectivamente.

Basado en UN (2005, cap. 7), se nota que los efectos de diseño no solo son diferentes para cada parámetro que se desea estimar sino que varían de acuerdo a la subpoblación en la que se realice la estimación. Por ejemplo, considere al considerar el parámetro proporción de hogares con electricidad, se estimó que el efecto de diseño para este parámetro fue de 7.92 a nivel nacional, de 1.03 en las áreas metropolitanas, de 4.43 en las ciudades grandes y de 7.27 en las áreas rurales. Por lo anterior, y basado en la expresión que define el efecto de diseño, se observó que, fijando \(\bar{n}_{II}\), el coeficiente de correlación intraclase varío dependiendo de la zona. En efecto, \(\rho_y= 0.76\) a nivel nacional, \(\rho_y= 0.0033\) en las zonas metropolitanas, \(\rho_y= 0.38\) en las ciudades grandes y \(\rho_y= 0.69\) en las áreas rurales. Lo anterior implicó que hay una mayor heterogeneidad de los hogares con electricidad entre las UPM a nivel nacional y en las áreas rurales, es decir algunos hogares tienen electricidad y otros no entre las UPM. Sin embargo, en las zonas metropolitanas la variación de esta variable entre las UPM es casi nula, es decir que todos lo hogares tienen electricidad entre las UPM de estas zonas.

Por otro lado, para la misma encuesta PNAD, los efectos de diseño para el número promedio de cuartos usados como dormitorios es de 2.14 a nivel nacional, de 2.37 en las áreas metropolitanas, de 1.72 en las ciudades grandes y de 2.09 en las áreas rurales. Considerando que \(\bar{n}_{II}=10\), el coeficiente de correlación intraclase es de \(\rho_y= 0.12\) a nivel nacional, \(\rho_y= 0.15\) en las zonas metropolitanas, \(\rho_y= 0.08\) en las ciudades grandes y \(\rho_y= 0.12\) en las áreas rurales. Lo anterior implica que hay una mayor homogeneidad del número de cuartos utilizados como dormitorio entre las UPM del país y de las zonas que lo componen.

Como se verá en los capítulos posteriores, al conocer el valor que toma el efecto de diseño para la estimación de un parámetro de interés, es posible crear escenarios de simulación que permitan establecer el tamaño de muestra en la planeación de las encuestas de hogares o en su rediseño después de la ronda de censos en una década particular.

Referencias

———. 2017. Applied survey data analysis. Chapman y Hall CRC statistics en the social y behavioral sciences series. CRC Press.
Lumley, Thomas. 2010. Complex surveys: a guide to analysis using R. Wiley series en survey methodology. Wiley.
UN. 2005. Household surveys in developing and transition countries. Studies en methods / United Nations, Department of Economic y Social Affairs, Statistics Division Series F.