Apéndice B Software

El diseño y análisis de la información proveniente de las encuestas de hogares debe contemplar el uso exhaustivo de las herramientas computacionales existentes. Esta sección revisa con detalle las aproximaciones computacionales del software estadístico utilizado para realizar cada uno de los procesos estadísticos que se necesitan para lograr el cometido de la publicación de cifras oficiales con altos niveles de precisión y confiabilidad. En particular, para los siguientes procesos:

Selección de muestras acorde al diseño de muestreo definido
Generación de pesos de muestreo para cada individuo y hogar.
Modelación de la ausencia de respuesta e imputación estadística.
Calibración de los pesos de muestreo y ajustes por ausencia de respuesta.
Estimación de los errores de muestreo para cada indicador de interés en los cuadros de producción estadística.
Análisis de las relaciones multivariantes entre las variables de la encuesta.
Modelación de las estimaciones para la predicción del parámetro de interés en dominios pequeños.

UN (2005, sec. 7.8) muestra la importancia de incluir la estructura del diseño de muestreo complejo en la inferencia que se realiza para la estimación de estadísticas oficiales a partir de encuestas de hogares y advierten con un ejemplo empírico que de no hacerlo, es posible que las estimaciones resultantes sean sesgadas y además sus errores de muestreo se vean subestimados. A continuación se muestran algunos de las características más importantes que los paquetes estadísticos computacionales incorporan en el manejo de datos que provienen de estructuras de muestreo complejas como las encontradas en las encuestas de hogares. Una revisión más exhaustiva y detallada que adjunta sintaxis y código computacional puede encontrarse en Heeringa, West, y Berglund (2010, Apéndice A).

En general, estas herramientas computacionales están pensadas para hacer más eficiente el uso de las aproximaciones de varianza en muestras complejas, así como las técnicas de replicación para obtener los estimativos de varianza inducidos por el diseño de muestreo (Westat 2007). Algunos de estos softwares son de uso libre, aunque la mayoría corresponde a productos licenciados cuya licencia debe ser pagada. En general estos productos, además de proveer estadísticas descriptivas (como medias, totales, proporciones, percentiles y razones), permiten ajustar modelos de regresión lineales y logísticos. Todas las estadísticas resultantes están basadas en el diseño de muestreo de la encuesta.

Referencias

Heeringa, Steven G., Brady T. West, y Patricia A. Berglund. 2010. Applied survey data analysis. Chapman y Hall/CRC statistics en the social y behavioral sciences series. CRC Press.

UN. 2005. Household surveys in developing and transition countries. Studies en methods / United Nations, Department of Economic y Social Affairs, Statistics Division Series F.

Westat. 2007. WesVar 4.3. Users guide. http://users.nber.org/~jroth/chap1.pdf.