7.2 Descomposición del efecto de diseño en las encuestas de hogares

Park (2003) propone que el efecto de diseño de cualquier encuesta se puede descomponerse en tres partes que se relacionan entre sí de forma multiplicativa. En primer lugar está el efecto debido a la ponderación desigual, \(DEFF^W\); en segundo lugar se encuentra el efecto debido a la estratificación, \(DEFF^S\); y por último se tiene el efecto debido al muestreo en varias etapas, \(DEFF^C\). Por lo tanto:

\[ DEFF = DEFF^W \times DEFF^S \times DEFF^C \]

La primera componente \(DEFF^W\) del efecto de diseño general tiende a aumentar ligeramente la variación de las estrategias de muestreo. Valliant, Dever, y Kreuter (2018) afirman que esta componente puede ser estimada por medio de la siguiente expresión:

\[ DEFF^W = 1 + cv^2(w_k) \]

En donde \(cv(w_k)\) representa el coeficiente de variación de los pesos de muestreo \(w_k\) de las unidades en la encuesta. Si los pesos de muestreo son uniformes, entonces no habrá un incremento significativo en la varianza de la estrategia. Es por esto que los esquemas autoponderados son deseables en los diseños de muestreo de las encuestas de hogares. Por otra parte, si los pesos de muestreo tienen una variación grande, entonces habrá un incremento significativo en la varianza y, por ende, en el tamaño de muestra. Como se verá más adelante, los ajustes en el factor de expansión pueden inducir una alta variabilidad y por consiguiente se recomienda, en la medida de lo posible, crear clases o subgrupos de ajuste para mitigar y acotar la dispersión de los pesos finales de la encuesta.

Al encontrar la mejor estratificación, nos aseguramos de que la segunda componente \(DEFF^S\) de esta descomposición sea menor a uno (es decir que la varianza se reduce). Lamentablemente, la reducción de la varianza no suele ser tan grande y no mitiga los efectos de aglomeración debido a las múltiples etapas de los diseños de muestreo complejos. Como lo indica H. A. Gutiérrez (2016), el efecto de diseño en el muestreo aleatorio estratificado sin reemplazo con asignación proporcional está dado por

\[ DEFF^S \cong\frac{\text{Varianza dentro de los estratos}}{\text{Varianza Total}} \]

Ahora, intuitivamente tenemos que la varianza total es la suma de la varianza dentro de los estratos con la varianza entre los estratos. Por tanto se concluye que, casi siempre, esta estrategia de muestreo arrojará mejores resultados que una estrategia aleatoria simple. Por otro lado, recordando que el efecto de diseño debido a la conglomeración de la población finita en las UPM está dado por la siguiente expresión:

\[ DEFF^C = 1 + (\bar{n}_{II}-1)\rho_y \]

En donde, \(\bar{n}_{II}\) es el número de hogares promedio que se seleccionan en cada UPM, y \(\rho_y\) es el coeficiente de correlación intraclase, calculado para la variable de interés sobre las UPM. Habiéndose definido el marco de muestreo en el momento del levantamiento de la información primaria censal, ya no se tendrá control sobre el valor del coeficiente de correlación intraclase (\(\rho_y\)); únicamente se tiene control sobre el número de viviendas que serán seleccionadas en promedio en las UPM (\(\bar{n}_{II}\)). Si el marco de muestreo quedó correctamente definido, entonces el valor de \(\rho_y\) será tan pequeño como fue posible establecerlo al proponer las UPM; de la misma manera, es recomendable que el equipo técnico dentro de los INE defina el menor número promedio posible de encuestas dentro de las UPM \(\bar{n}_{II}\) para que el efecto de aglomeración sea mínimo.

En general, la disminución del \(DEFF\) debido a la estratificación se matiza con el aumento del \(DEFF\) debido a la desigualdad de los pesos de muestreo. Es por esto que \(DEFF^C\) predomina en el efecto de diseño general y es la razón por la cual se le presta mucha atención. UN (2008b) propone que, para mitigar los efectos del muestreo multietápico, se consideren las siguientes estrategias:

Seleccionar tantas UPM como sea posible.
Definir las UPM tan pequeñas como sea posible, en términos del número de viviendas que las componen.
Seleccionar un número fijo de viviendas dentro de las UPM seleccionadas, en vez de un número variable.
Utilizar un muestreo sistemático en la UPM, en vez de seleccionar segmentos de viviendas contiguas.

Al encontrar la mejor estratificación, los funcionarios de los INE permiten que la segunda componente \(DEFF^S\) de la descomposición del efecto de diseño general sea mínima para los indicadores estudiados. También es tarea de los INE asegurar que los efectos de diseño dados por el efecto de conglomeración y el uso del muestreo en varias etapas \(DEFF^C\) sea mínimo. En este caso, se deberá estudiar, para cada encuesta y operación estadística que haga uso del marco de muestreo estratificado, la relación entre UPM y hogares a la luz de los indicadores de interés; en particular, es necesario decidir cuántos hogares serán seleccionados en cada UPM y cuántas UPM serán seleccionadas dentro de cada estrato

De la mima manera, y como se verá en los siguientes capítulos, el efecto debido al uso de factores de ponderación desiguales \(DEFF^W\) puede ser minimizado al decidir, a la luz de la correlación entre los indicadores particulares de cada encuesta de hogares, cuáles variables de control serán utilizadas en la calibración de los estimadores. De esta forma, en esta estrategia tripartita, se asegura que el efecto de diseño general de las encuestas sea pequeño.

Referencias

———. 2016. Estrategias de muestreo: diseño de encuestas y estimación de parámetros. Segunda edición. Ediciones de la U.

Park, Inho. 2003. «Design Effects and Survey Planning», 8.

———. 2008b. Designing household survey samples: practical guidelines. Studies en methods / United Nations, Department of Economic y Social Affairs, Statistics Division Series F. United Nations.

———. 2018. Practical Tools for Designing and Weighting Survey Samples. Statistics for Social y Behavioral Sciences. Springer International Publishing. https://doi.org/10.1007/978-3-319-93632-1.