16.1 Esquemas de acumulación de muestras

Antes de entrar en los detalles técnicos involucrados en este tipo de procedimientos, tomemos una situación ejemplificante específica para ilustrar la problemática que se quiere abordad. Para esto, suponga que un INE en América Latina ha previsto una nueva forma de análisis de su encuesta de empleo. Con el fin de tener representatividad a un nivel más desagregado (provincial, por ejemplo), y para poder realizar una estimación más precisa, ha decidido realizar una agregación anual de todos los levantamientos de su encuesta de empleo. Por ejemplo, suponga que en los meses de marzo, junio, septiembre y diciembre se planean levantamientos trimestrales y que este esquema considera una representatividad nacional, en el área urbana y rural, aunque no lo hacía con la representatividad provincial, ni de las ciudades principales del país. Con la metodología de agregación de muestras podría ser posible asegurar la representatividad en las provincias desagregadas por área (urbano o rural).

Los procesos de acumulación de muestras son realizados con frecuencia en las encuestas continuas con publicación trimestral. Por ejemplo, se puede planear levantamientos mensuales y acumular tres meses para realizar la publicación trimestral de la cifra de desempleo. De hecho, algunos países han decidido publicar cifras mensuales del desempleo teniendo en cuenta la acumulación de los últimos tres levantamientos, lo que es conocido cono trimestres móviles. Teniendo en cuenta el diseño rotativo que muchas encuestas implementan en América Latina, una de las bondades de estos esquemas de agregación de muestras en los trimestres móviles es que el panel original se mantiene y además, por diseño, la misma vivienda no es entrevistada dos veces en el trimestre móvil. En este tipo de diseños, inclusive es posible que, al final de cada año en diciembre, se contemple la publicación de un gran agregado anual que contemple la agregación de los doce meses anteriores. En este escenario sí existen viviendas que han sido entrevistadas dos o más veces y este porcentaje, dependiendo del diseño rotativo, puede no ser bajo. Por ejemplo, en un panel 2(2)2, el diseño rotativo induce un traslape natural del 50% entre trimestres.

Korn y Graubard (1999, cap. 7 y 8) proveen un recuento exhaustivo sobre las opciones de ponderación y otros temas a considerar cuando se combinan datos a lo largo del tiempo en encuestas complejas. En el caso de la agregación de muestras se resalta que todas las viviendas que han sido entrevistadas en más de una ocasión deben pertenecer a la misma UPM por diseño. Es muy importante que la identificación de las UPM y de los estratos de muestreo se realice de manera inequívoca y se debe asegurar que los siguientes principios se cumplan a cabalidad:

  1. Cuando se combinan dos o más oleadas del mismo panel es importante asegurarse que las UPM sean emparejadas correctamente, de tal forma que el software las reconozca como iguales.
  2. Cuando se combinan dos o más muestras independientes es importante asegurarse que las UPM estén codificada de tal forma que el software las reconozca como distintas.

Cuando se trata de estimar las varianzas de este tipo de estimadores, los cálculos analíticos se tornan mucho más complicados. Train, Cahoon, y Makens (1978) muestran lo complicado que puede ser calcular las variaciones de los promedios de las estimaciones de múltiples períodos de tiempo en una encuesta repetida y cómo estos cálculos dependen en gran manera del patrón de traslape definido en el diseño de la encuesta. Para las encuestas de población activa, a menudo se utiliza un enfoque computacional basado en métodos de remuestreo, como Jackknife, Bootstrap o BRR. Nótese que el uso apropiado de tales métodos, también dependerá del origen de la encuesta y de sus objetivos. Por ejemplo, los insumos de aplicación de los métodos serían unos si la encuesta está orientada a medir el desempleo, y serían otros si la encuesta está diseñada para estimar los cambios brutos entre dos periodos de tiempo.

Referencias

Korn, Edward Lee, y Barry I. Graubard. 1999. Analysis of health surveys. Wiley.
Train, G., L. Cahoon, y P. Makens. 1978. «The Current Population Survey Variances, Inter-Relationships and Design Effects». En.