5.1 Estimaciones de totales
En esta sección se realizarán los procesos de estimación de variables categóricas. En primera instancia se presenta cómo se estima los tamaños de la población y subpoblaciones.
<- diseno %>% group_by(Zone) %>%
tamano_zona summarise( n = unweighted(n()),
Nd = survey_total(vartype = c("se","ci")))
tamano_zona
## # A tibble: 2 × 6
## Zone n Nd Nd_se Nd_low Nd_upp
## <chr> <int> <dbl> <dbl> <dbl> <dbl>
## 1 Rural 1297 72102 3062. 66039. 78165.
## 2 Urban 1308 78164 2847. 72526. 83802.
En la tabla anterior, n denota el número de observaciones en la muestra por Zona y Nd denota la estimación del total de observaciones en la población. Adicionalmente, en el código anterior se introdujo la función unweighted
la cual, calcula resúmenes no ponderados a partir de un conjunto de datos de encuestas.
Para el ejemplo, el tamaño de muestra en la zona rural fue de 1297 personas y para la urbana fue de 1308. Con esta información se logró estimar una población de 72102 con una desviación estándar de 3062.204 en la zona rural y una población de 78164 con desviación estándar de 2847.221 en la zona urbana. Así mismo, con una confianza del 95% se construyeron unos intervalos de confianza para el tamaño poblacional en la zona rural de (66038.5, 78165.4) y para la urbana de (72526.2, 83801.7).
Ahora bien, empleando una sintaxis similar a la anterior es posible estimar el número de personas en condición de pobreza extrema, pobreza y no pobres como sigue:
<- diseno %>% group_by(Poverty) %>%
tamano_pobreza summarise( Nd = survey_total(vartype = c("se","ci")) )
tamano_pobreza
## # A tibble: 3 × 5
## Poverty Nd Nd_se Nd_low Nd_upp
## <fct> <dbl> <dbl> <dbl> <dbl>
## 1 NotPoor 91398. 4395. 82696. 100101.
## 2 Extreme 21519. 4949. 11719. 31319.
## 3 Relative 37349. 3695. 30032. 44666.
De la tabla anterior podemos concluir que, la cantidad estimada de personas en estado de no pobreza son 91398.3, en pobreza 37348.9 y pobreza extrema de 21518.7. os demás parámetros estimados se interpretan de la misma manera que para la estimación desagregada por zona.
En forma similar es posible estimar el número de personas debajo de la línea de pobreza.
<- diseno %>%
tamano_pobreza group_by(pobreza) %>%
summarise(
Nd = survey_total(vartype = c("se","ci")))
tamano_pobreza
## # A tibble: 2 × 5
## pobreza Nd Nd_se Nd_low Nd_upp
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 0 91398. 4395. 82696. 100101.
## 2 1 58868. 5731. 47519. 70216.
Concluyendo para este ejemplo que, 58867.6 personas están por debajo de la línea de pobreza con una desviación estándar de 5731.3 y un intervalo de confianza (47518.9 70216.3).
Otra variable de interés en encuestas de hogares es conocer el estado de ocupación de las personas. A continuación, se muestra el código computacional:
<- diseno %>%
tamano_ocupacion group_by(Employment) %>%
summarise( Nd = survey_total(vartype = c("se","ci")))
tamano_ocupacion
## # A tibble: 4 × 5
## Employment Nd Nd_se Nd_low Nd_upp
## <fct> <dbl> <dbl> <dbl> <dbl>
## 1 Unemployed 4635. 761. 3129. 6141.
## 2 Inactive 41465. 2163. 37183. 45748.
## 3 Employed 61877. 2540. 56847. 66907.
## 4 <NA> 42289. 2780. 36784. 47794.
De los resultados de la estimación se puede concluir que, 4634.8 personas están desempleadas con un intervalo de confianza de (3128.6, 6140.9). 41465.2 personas están inactivas con un intervalo de confianza de (37182.6, 45747.8) y por último, 61877.0 personas empleadas con intervalos de confianza (36784.2, 47793.5).
Utilizando la función group_by
es posible obtener resultados por más de un nivel de agregación. A continuación, se muestra la estimación ocupación desagregada por niveles de pobreza:
<- diseno %>%
tamano_ocupacion_pobreza group_by(Employment, Poverty) %>%
cascade( Nd = survey_total(vartype = c("se","ci")), .fill = "Total") %>%
data.frame()
tamano_ocupacion_pobreza
## Employment Poverty Nd Nd_se Nd_low Nd_upp
## 1 Unemployed NotPoor 1768.375 405.3765 965.6891 2571.061
## 2 Unemployed Extreme 1169.201 348.1340 479.8603 1858.541
## 3 Unemployed Relative 1697.231 457.8077 790.7262 2603.736
## 4 Unemployed Total 4634.807 760.6242 3128.6948 6140.919
## 5 Inactive NotPoor 24346.008 1736.2770 20908.0064 27784.010
## 6 Inactive Extreme 6421.825 1320.7349 3806.6383 9037.012
## 7 Inactive Relative 10697.414 1460.2792 7805.9155 13588.913
## 8 Inactive Total 41465.248 2162.8040 37182.6798 45747.816
## 9 Employed NotPoor 44600.347 2596.1915 39459.6282 49741.065
## 10 Employed Extreme 5127.531 1121.6461 2906.5601 7348.503
## 11 Employed Relative 12149.142 1346.6159 9482.7078 14815.576
## 12 Employed Total 61877.020 2540.0762 56847.4153 66906.624
## 13 Total Total 150266.000 4181.3587 141986.4921 158545.508
## 14 <NA> NotPoor 20683.603 1256.6158 18195.3777 23171.827
## 15 <NA> Extreme 8800.209 2979.9150 2899.6792 14700.738
## 16 <NA> Relative 12805.115 1551.0291 9733.9220 15876.307
## 17 <NA> Total 42288.926 2779.9913 36784.2652 47793.586
De lo cual se puede concluir, entre otros que, 44600.3 personas que trabajan no son pobres con un intervalo de confianza (39459.6, 49741.0) y 6421.8 inactivas están en pobreza extrema con un intervalo de confianza de (3806.6, 9037.0).