Capítulo 1 Introducción

FALTA ESTO: BADEHOG en la Cepal

Las encuestas de hogares se han consolidado como una de las principales fuentes de información estadística para el diseño, la evaluación y el seguimiento de políticas públicas. Su relevancia se extiende más allá del ámbito nacional: constituyen un insumo indispensable para el monitoreo de los Objetivos de Desarrollo Sostenible (ODS) en el marco de la Agenda 2030. Gracias a la amplitud temática que abarcan —educación, salud, empleo, ingresos, condiciones de vida y pobreza, entre otros—, las encuestas de hogares permiten elaborar indicadores que reflejan la situación de las poblaciones y orientan la formulación de estrategias de desarrollo inclusivas y sostenibles.

Sin embargo, la utilidad de estas encuestas no depende únicamente de la calidad del operativo de campo. La producción de estadísticas oficiales exige un compromiso adicional: garantizar que los resultados sean precisos, confiables y comparables. En este sentido, las oficinas nacionales de estadística y los investigadores deben adoptar métodos robustos que respeten los Principios Fundamentales de las Estadísticas Oficiales de las Naciones Unidas, particularmente aquellos relacionados con la responsabilidad y transparencia (Principio 3) y la prevención del uso indebido de la información (Principio 4). Estos principios enfatizan la necesidad de documentar y difundir con claridad las fuentes, los métodos y los procedimientos utilizados, así como de pronunciarse cuando se detectan interpretaciones incorrectas de los datos.

En las últimas décadas, la revolución informática y el acceso cada vez mayor a software estadístico han multiplicado las posibilidades de análisis. Hoy en día, los datos de encuestas de hogares se utilizan tanto en aplicaciones descriptivas (como la estimación de medias poblacionales, tasas de pobreza o distribuciones de frecuencia) como en aplicaciones analíticas o inferenciales (pruebas de hipótesis, construcción de modelos de regresión, estimaciones de bienestar multidimensional). Sin embargo, este avance trae consigo un riesgo: los programas estadísticos tradicionales, cuando se emplean sin tener en cuenta la complejidad del diseño muestral, pueden producir estimaciones sesgadas e intervalos de confianza engañosos, induciendo a conclusiones erróneas que pueden repercutir en la toma de decisiones públicas.

El desafío central reside en que las encuestas de hogares rara vez utilizan un muestreo aleatorio simple. Por el contrario, se basan en diseños de muestreo complejos que incorporan procedimientos como:

  • Estratificación, donde la población se divide en subgrupos homogéneos (por ejemplo, región, área urbana/rural o nivel socioeconómico), a partir de los cuales se seleccionan muestras independientes. Este procedimiento asegura representatividad y mejora la precisión de las estimaciones.
  • Conglomeración, que consiste en agrupar las unidades de observación en unidades primarias de muestreo (manzanas, sectores censales, áreas de enumeración). En una primera etapa se seleccionan los conglomerados, y en etapas subsiguientes los hogares dentro de estos.
  • Probabilidades desiguales de selección, diseñadas para garantizar la inclusión adecuada de subpoblaciones de interés, especialmente aquellas pequeñas o con alta heterogeneidad.
  • Ajustes de ponderación, mediante los cuales los factores de expansión iniciales se corrigen para compensar problemas de cobertura, no respuesta o para calibrar los resultados frente a totales poblacionales conocidos.

Estas características convierten al análisis de encuestas en una tarea especializada, que requiere técnicas específicas para obtener estimaciones no sesgadas y una correcta cuantificación de la incertidumbre.

En este marco, el presente libro tiene como objetivo principal ofrecer al lector una guía práctica y accesible para el análisis de encuestas complejas, con un énfasis particular en las dinámicas de los hogares. Se propone como un material tanto de formación como de consulta, que combina la explicación conceptual con la aplicación práctica en el software estadístico R. La elección de R responde a tres razones fundamentales: (i) es un software de código abierto, disponible gratuitamente para cualquier usuario o institución; (ii) cuenta con un ecosistema robusto de paquetes especializados, entre ellos survey, que facilita el trabajo con diseños muestrales complejos; y (iii) es ampliamente adoptado por la comunidad académica y los institutos de estadística, lo que lo convierte en una herramienta idónea para la enseñanza, la replicación y la transparencia en los procesos analíticos.

El lector encontrará a lo largo del libro no solo los fundamentos teóricos, sino también ejemplos reproducibles, tablas y gráficos generados íntegramente en R, acompañados del código necesario para su replicación. De esta manera, se busca que cada usuario pueda adaptar los procedimientos a sus propios datos y necesidades.

La estructura del libro se organiza en capítulos progresivos:

  • El Capítulo 2 introduce los conceptos esenciales sobre encuestas complejas y su importancia en el análisis de hogares.
  • Los Capítulos 3 y 4 desarrollan la teoría de las variables aleatorias discretas y continuas en el contexto del muestreo probabilístico, sentando las bases para el análisis inferencial.
  • El Capítulo 5 aborda la estimación de modelos de regresión lineal, mientras que el Capítulo 6 introduce el ajuste de modelos de regresión logística, ambos pilares del análisis aplicado en encuestas de hogares.
  • Los Capítulos 7 y 8 amplían el enfoque hacia modelos lineales generalizados y multiniveles, necesarios para capturar relaciones más complejas y estructuras jerárquicas de los datos.
  • El Capítulo 9 se centra en la imputación de datos, una herramienta indispensable para enfrentar el aumento de la no respuesta, fenómeno que se intensificó tras la pandemia.
  • Finalmente, el Capítulo 10 explora las técnicas de visualización y comunicación de resultados, un aspecto crucial para garantizar que los hallazgos lleguen de manera clara y efectiva a audiencias técnicas y no técnicas.

Con esta estructura, el libro pretende dotar al lector de un conjunto integral de herramientas que abarcan desde los fundamentos conceptuales hasta las aplicaciones más avanzadas. Más allá de ser un manual técnico, busca contribuir a una cultura estadística orientada a la calidad, la transparencia y la utilidad de la información derivada de encuestas de hogares.

En síntesis, este libro se propone como una guía para investigadores, estudiantes y profesionales que deseen comprender y aplicar los métodos de análisis de encuestas complejas en R, y como un aporte al fortalecimiento de las capacidades estadísticas en la región. Al integrar teoría, práctica y principios internacionales, aspira a fomentar análisis más rigurosos y decisiones más informadas, contribuyendo así al avance del conocimiento y al logro de los objetivos de desarrollo en nuestras sociedades.