8.5 Tamaño de muestra para UPM y hogares

En algunas ocasiones la variable de interés y la unidad de observación están a nivel de hogar. Por ejemplo, cuando todas las variables de interés se miden a nivel de la vivienda o del hogar. En este caso es posible modificar el algoritmo de la sección anterior para seleccionar únicamente a las viviendas u hogares en la muestra, sin necesidad de realizar un submuestreo de personas. En este caso algunas cantidades desaparecen porque no son objeto de la población de hogares, como lo son \(r\) y \(b\); algunas otras expresiones deben ser redefinidas al contexto de los hogares, como por ejemplo, el coeficiente de correlación intraclase \(\rho_y\), el efecto de diseño y todas las expresiones de tamaños de muestra. En todo caso, la adaptación del algoritmo se describe a continuación.

  • Definir el número promedio de hogares. El número promedio de hogares que se desea encuestar en cada una de las UPM está dado por \(\bar{n}_{II}\). Esta cifra sigue siendo el insumo más importante del algoritmo y se propone crear escenarios de muestreo a partir de su modificación y evaluación del tamaño de muestra final.

  • Calcular el efecto de diseño. Es necesario definir (o calcular con encuestas o censos anteriores) la correlación intraclase \(\rho_y\) de la variable de interés a nivel del hogar con el agrupamiento por UPM definido por la división cartográfica del último censo. De igual forma, el efecto de diseño \(DEFF \approx 1 + (\bar{n}_{II} - 1)\rho_y\) sigue siendo función del tamaño de muestra promedio de hogares por UPM \((\bar{n}_{II})\).

  • Tamaño de muestra de hogares. Partiendo de las expresiones de tamaño de muestra generales para muestreos complejos y teniendo en cuenta que la población de interés son los hogares y que la variable de interés está a nivel de hogar, entonces el tamaño de muestra necesario para alcanzar un margen de error relativo máximo de \(MER\) % es de

\[ n_{II} \geq \dfrac{S^2_{y}DEFF}{\dfrac{MER^2 \bar{y}^2}{z_{1-\alpha/2}^2}+\dfrac{S^2_{y_U}DEFF}{N_{II}}} \]

La expresión apropiada para calcular el tamaño de muestra para una proporción estará dada por \[ n_{II} \geq \dfrac{P\ (1-P)\ DEFF}{\dfrac{MER^2P^2}{z_{1-\alpha/2}^2}+\dfrac{P\ (1-P) \ DEFF}{N_{II}}} \]

  • Cálculo del número de UPM. Los hogares se observan a partir de las UPM. En este paso final es necesario calcular el número de UPM que deben ser seleccionadas en el muestreo a partir de la relación \[ n_{I} = \frac{n_{II}}{\bar{n}_{II}} \]

8.5.1 Ejemplo: gasto promedio del hogar

Suponga que se desea estimar el promedio de gasto anual en dólares en los hogares del país con un margen de error relativo máximo admisible del 3.5%. La variable de interés (gasto) es continua y se estima que la media oscila alrededor de \(\bar{y}_U=1407\) dólares con una varianza de \(S^2_{y_U}=2228^2\). En este ejemplo se supone que el país está dividido en \(N_I = 10\) mil UPM y la correlación intraclase de la característica de interés, medida a nivel del hogar, con las UPM es de \(\rho_y = 0.173\).

La siguiente tabla muestra los resultados del ejercicio para \(\bar{n}_{II} = 12\) hogares promedio por UPM, que serán observados a partir de la selección de \(n_{II} = 16056\) hogares y \(n_{I} = 16056 / 12 = 1338\) UPM, los cuales inducen un efecto de diseño \(DEFF =\) 2.9.

Hogares promedio por UPM \((\bar{n}_{II})\) DEFF Muestra de UPM \((n_I)\) Muestra de hogares \((n_{II})\)
12 2.9 1338 16056

A continuación se muestran algunos resultados que permiten establecer otros escenarios de muestreo al variar el tamaño de muestra promedio de hogares por UPM. Nótese que, por ejemplo, en el caso de seleccionar 20 hogares por UPM, se debería seleccionar una muestra de 23695 hogares en tan solo 1185 UPM. Por otro lado, si sólo se seleccionaran 2 hogares por UPM, se tendrían que visitar 3246 UPM en todo el país, aunque el número de encuestas totales descendería a 6493.

Para este tipo de operativos, en donde los cuestionarios de gasto de los hogares están acompañados de un operativo exhaustivo que le permite al investigador conocer los hábitos de consumo del hogar de forma desagregada, y en donde se visita el hogar durante un periodo de tiempo determinado, tal vez sea más conveniente estudiar la viabilidad de seleccionar más hogares por UPM y menos UPM para que el operativo de campo no exija la contratación de demasiado personal en campo. Al estar agrupados en menos UPM, se podría definir un mejor levantamiento de la información con un equipo mediano de personas; de lo contrario, se debería contratar bastante más personal que cubra las UPM dispersas a lo largo del país. Siguiendo las recomendaciones internacionales, se desestimarían los escenarios con efectos de diseño mayores a 3.

Tabla de muestreo para la estimación del gasto promedio del hogar en el ejemplo.
Hogares promedio por UPM \((\bar{n}_{II})\) DEFF Muestra de UPM \((n_I)\) Muestra de hogares \((n_{II})\)
2 1.2 3246 6493
4 1.5 2102 8407
6 1.9 1720 10320
8 2.2 1529 12233
10 2.6 1414 14145
12 2.9 1338 16056
14 3.2 1283 17967
16 3.6 1242 19877
18 3.9 1210 21787
20 4.3 1185 23695

8.5.2 Ejemplo: proporción de hogares sin agua potable

Suponga que se desea obtener una muestra con un margen de error relativo máximo admisible del 10% sobre la variable de interés (necesidades básicas insatisfechas en agua) y el parámetro de interés es el porcentaje de hogares con esta carencia. En este país, se estima que la proporción de hogares con esta condición asciende a \(P = 7.5\)%. En este ejemplo se supone que la correlación intraclase de la característica de interés con las UPM es de \(\rho_y = 0.045\).

La siguiente tabla muestra los resultados del ejercicio para \(\bar{n}_{II} =\) 10 hogares por UPM, que serán observados a partir de la selección de \(n_{II} = 4360\) hogares en \(n_{I} = 4360/10 = 436\) UPM, que inducen un efecto de diseño \(DEFF =\) 1.3.

Hogares promedio por UPM \((\bar{n}_{II})\) DEFF Muestra de UPM \((n_I)\) Muestra de hogares \((n_{II})\)
10 1.3 436 4360

A continuación se muestran algunos resultados que permiten establecer otros escenarios de muestreo al variar el tamaño de muestra promedio de hogares por UPM. Observe que el efecto de diseño DEFF es directamente proporcional al número de hogares entrevistados por UPM y al tamaño de muestra de hogares final; de la misma manera, es inversamente proporcional al número de UPM.

Tabla de muestreo para la estimación de la proporción de hogares sin agua potable en el ejemplo.
Hogares promedio por UPM \((\bar{n}_{II})\) DEFF Muestra de UPM \((n_I)\) Muestra de hogares \((n_{II})\)
5 1.1 758 3790
10 1.3 436 4360
15 1.5 328 4924
20 1.6 274 5490
25 1.8 242 6057
30 2.0 221 6624
35 2.2 205 7190
40 2.3 194 7757
45 2.5 185 8323