3.2 La base de datos BigCity
Gambino y do Nascimento Silva (2009) afirman que, desde que se popularizaron las encuestas de hogares en 1940, se ha hecho evidente algunas tendencias que están ligadas a los avances tecnológicos en las agencias estadísticas y en la sociedad y, con la introducción del computador, se ha acelerado su uso. Detrás de cada encuesta hay una muestra, y detrás de cada muestra hay un esquema de selección por muestreo probabilístico.
El muestreo es un procedimiento que responde a la necesidad de información estadística precisa sobre una población objetivo de estudio; Como lo menciona Gutiérrez (2009), el muestreo trata con investigaciones parciales sobre la población que apuntan a inferir a la población completa. Es así como en las últimas décadas ha tenido bastante desarrollo en diferentes campos principalmente en el sector gubernamental con la publicación de las estadísticas oficiales que permiten realizar un seguimiento a las metas del gobierno, en el sector académico, en el sector privado y de comunicaciones.
Como se ha venido mencionando anteriormente, este documento está enfocado en el análisis de las encuestas de hogares. En ese sentido y para que el lector tenga un fundamento estándar a través de sus capítulos, en este documento se utilizará, para los ejemplos computacionales, la base de datos BigCity
del paquete TeachingSampling
. Esta base de datos corresponde a un conjunto de datos que contiene algunas variables socioeconómicas de \(150266\) personas de una ciudad en un año en particular. Algunas de las variables de esta base de datos son:
- HHID, que corresponde al identificador del hogar.
- PersonID, que hace referencia al identificador de la persona dentro del hogar.
- Stratum, que asigna el estrato geográfico del hogar. Son 119 estratos.
- PSU, que corresponde a las unidades primarias de muestreo. La base de datos cuenta con \(1664\) PSU.
- Zone, que identifica las áreas urbanas o rurales a lo largo de la ciudad.
- Sex, que establece el sexo del entrevistado.
- Income, que detalla los ingresos mensuales per cápita.
- Expenditure, que describe los gastos mensuales per cápita.
- Employment, que muestra la situación laboral de la persona entrevistada.
- Poverty, que indica si la persona es pobre o no. Depende de los ingresos.