8.6 Tamaño de muestra para UPM y personas

En algunos casos en donde la variable de interés esté a nivel de persona y el cuestionario de la encuesta no induzca preguntas acerca del hogar, y además exista un inventario detallado de las personas que residen en cada UPM, es posible evadir la selección de los hogares e ir directamente a la selección de personas. En este caso, la lógica del cálculo del tamaño de muestra se mantiene modificando en cierta manera el algoritmo de las secciones anteriores, tal como se ilustra a continuación.

Definir la población de interés de manera explícita. En este caso solo se mantiene la expresión correspondiente a \(r\) que denota el porcentaje de personas con la característica de interés en la población.
Definir el número promedio de personas. El número promedio de personas (casos de la población objetivo) que se desean encuestar por cada UPM está dado por \(\bar{n}\). Al igual que en las secciones anteriores, se recomienda hacer una evaluación sobre esta cantidad para determinar posibles escenarios de muestreo.
Calcular el efecto de diseño. Es necesario definir el efecto de diseño \(DEFF\) como una función de la correlación existente entre la variable de interés y la conformación de las UPM. De esta forma, \(DEFF \approx 1 + (\bar{n} - 1)\rho_y\). Nótese que esta cifra solo podrá ser calculada sobre la población de interés.
Tamaño de muestra de personas. A partir de las expresiones de tamaño de muestra para muestreos complejos, calcular el tamaño de muestra necesario para lograr una precisión adecuada en la inferencia. En este caso, las expresiones de tamaño de muestra coinciden con las del primer escenario.
Tamaño de muestra final. Es necesario calcular el número total de personas que deben ser seleccionados para lograr observar a quienes hacen parte de la población objetivo. Esta cantidad está dada por \(n / r\).
Cálculo del número de UPM. Finalmente, las personas se observan a partir de las UPM. En este paso final es necesario calcular el número de UPM que deben ser seleccionadas en el muestreo a partir de la relación. \[ n_{I} = \frac{n}{\bar{n}} \]

8.6.1 Ejemplo: ingreso promedio en personas empleadas

Suponga que se desea estimar el ingreso promedio en las personas empleadas con un margen de error relativo máximo admisible del 2%. La variable de interés (ingreso) es continua y se estima que la media oscila alrededor de \(\bar{y}_U=1458\) dólares con una varianza de \(S^2_{y_U}=2191^2\). Nótese que la población objetivo son todas las personas empleadas, cuya proporción se estima en \(r = 46\)%. La correlación intraclase de la característica de interés es \(\rho_y = 0.038\).

La siguiente tabla muestra los resultados del ejercicio al seleccionar \(\bar{n} = 23\) personas de la población de interés por UPM, que a su vez implica que por cada UPM se deberían seleccionar y enlistar en promedio \(23/0.46 = 50\) personas por UPM. Con lo anterior se esperarían \(n = 28029\) personas empleadas en la muestra repartidas en \(n_{I} = 28029 / 23 \cong 1219\) UPM; en este caso se obtendría un efecto de diseño \(DEFF = 1.8\). Nótese que en este escenario, el operativo de campo abarcaría la selección y enlistamiento de \(28029/0.46 \cong 60933\) personas, de las cuales se esperaría que 28029 fueran de la población de interés (personas empleadas).

Personas seleccionadas por UPM \((\bar{n} / r )\)	Personas empleadas por UPM \(\bar{n}\)	DEFF	Muestra de UPM \((n_I)\)	Muestra de personas empleadas \((n)\)	Muestra de personas \((n/r)\)
50	23	1.8	1219	28029	60933

A continuación se muestran algunos resultados que permiten establecer otros escenarios de muestreo cuando se varía el tamaño de muestra promedio de hogares por UPM. Siguiendo las recomendaciones internacionales, se desestimarían los escenarios con efectos de diseño mayores a 3.

Tabla de muestreo para la estimación del ingreso promedio en personas empleadas en el ejemplo.
Personas seleccionadas por UPM \((\bar{n} / r )\)	Personas empleadas por UPM \(\bar{n}\)	DEFF	Muestra de UPM \((n_I)\)	Muestra de personas empleadas \((n)\)	Muestra de personas \((n/r)\)
25	12	1.4	1857	21360	46435
50	23	1.8	1219	28029	60933
75	34	2.3	1006	34695	75424
100	46	2.7	899	41360	89913
125	58	3.1	835	48023	104398

8.6.2 Ejemplo: proporción de personas analfabetas pobres

Suponga que se quiere estimar la proporción de incidencia de la pobreza sobre la población analfabeta con un margen de error relativo máximo admisible del 15%. Se ha estimado que alrededor del \(r = 14\)% de las personas del país no saben leer ni escribir. Por otro lado, tal como se vio en un ejemplo anterior, el fenómeno de la pobreza está estimado en \(P = 4\)%. y la correlación intraclase de la característica de interés es \(\rho_y = 0.0454\).

La siguiente tabla muestra los resultados del ejercicio al seleccionar un promedio de \(\bar{n} = 14\) personas por UPM que no saben leer ni escribir; esto implica la selección y enlistamiento de \(14 / 0.14 = 100\) personas por UPM. Con lo anterior se obtendría un efecto de diseño \(DEFF =\) 1.6, para un total de personas en la muestra de \(n = 4574\) personas analfabetas, de una muestra 32671 personas enlistadas y repartidas en \(n_{I} = 4574/14 \cong 327\) UPM.

Personas seleccionadas por UPM \((\bar{n} / r)\)	Personas analfabetas por UPM \((\bar{n})\)	DEFF	Muestra de UPM \((n_I)\)	Muestra de personas analfabetas \((n)\)	Muestra de personas \((n/r)\)
100	14	1.6	327	4574	32671

Es posible plantear otros escenarios a medida que se evalúe el efecto que conlleva el cambio del número de hogares que se seleccionan en cada UPM. A continuación se muestran algunos resultados que permite establecer estos escenarios cuando se varía el tamaño de muestra promedio de hogares por UPM.

Tabla de muestreo para la estimación de la proporción de personas analfabetas pobres en el ejemplo.
Personas seleccionadas por UPM \((\bar{n} / r )\)	Personas analfabetas por UPM \((\bar{n})\)	DEFF	Muestra de UPM \((n_I)\)	Muestra de personas analfabetas \((n)\)	Muestra de personas \((n/r)\)
25	3.5	1.1	917	3211	22936
50	7.0	1.3	524	3665	26179
75	10.5	1.4	392	4120	29429
100	14.0	1.6	327	4574	32671
125	17.5	1.7	287	5029	35921