4.4 Estimación del coeficiente de Ginni en encuestas de hogares
Para iniciar esta sección tengamos en cuenta la siguiente reflexión: Definir lo justo siempre será difícil y es algo a lo que quizá sea poco realista aspirar a conseguir. Sin embargo si estamos un poco más conscientes de cómo la desigualdad afecta nuestra libertad y cómo se refleja en el bienestar y calidad de vida de las personas, podremos poner en contexto una discusión que tendremos cada vez más presente en el mundo y en el país.
La desigualdad en todos los aspectos es un problema más comunes en todos los países del mundo. Particularmente, la desigualdad económica es un problema que atañe a muchas instituciones internacionales como, por ejemplo, Naciones Unidas quien tiene este problema detectado en los Objetivos de Desarrollo Sostenibles (ODS, por sus siglas). Dado lo anterior, es clave poder medir la desigualdad económica de los hogares en los países y para esto, el indicador más utilizado es el coeficiente de Gini (CG). El valor del índice de Gini se encuentra entre 0 y 1. Un valor del coeficiente de Gini de \(G = 0\) indica perfecta igualdad en la distribución de la riqueza, con valores más grandes significa una desigualdad cada vez mayor en la distribución de la riqueza. Siguiendo la ecuación de estimación de Binder y Kovacevic (1995), un estimador del coeficiente de Gini es:
\[\begin{eqnarray*} \hat{G}\left(y\right) & = & \frac{2\times\sum_{h=1}^{H}\sum_{\alpha=1}^{a_{h}}\sum_{i=1}^{n_{h\alpha}}\omega_{h\alpha i}^{*}\hat{F}_{h\alpha i}y_{h\alpha i}-1}{\bar{y}_{\omega}} \end{eqnarray*}\]
Donde,
\(\omega_{h\alpha i}^{*}=\frac{\omega_{h\alpha i}}{\sum_{h=1}^{H}\sum_{\alpha=1}^{a_{h}}\sum_{i=1}^{n_{h\alpha}}\omega_{h\alpha i}}\).
\(\hat{F}_{h\alpha i}=\) La estimación de la CDF en el conglomerado \(\alpha\) en el estrato \(h\).
\(\bar{y}_{\omega}=\) La estimación del promedio.
Para calcular el índice de Gini y su varianza estimada en una encuesta de hogares, R
tiene cargados los procedimientos en la librería convey
. A continuación, se muestra la sintaxis de cómo se realiza la estimación del índice de Gini para los hogares en la base de ejemplo de este capítulo.
library(convey)
<- convey_prep(diseno)
diseno_gini svygini( ~Income, design = diseno_gini) %>%
data.frame()
## gini Income
## Income 0.4132757 0.0186633
En primer lugar, se carga el diseño de muestreo con la función convey_prep
. Luego, se estima el índice Gini con la función svygini
. En los argumentos de esta última función se introducen la variable ingresos y el diseño muestral complejo.
Por otro lado, si el interés ahora es estimar la curva de Lorenz. La cual, según Kovacevic, M. S. et. al (1997) para una distribución dada de ingresos, traza el porcentaje acumulado de la población (desplegado desde el más pobre hasta el más rico) frente a su participación en el ingreso total. El área entre la curva de Lorenz y la línea de 45 grados se conoce como el área de Lorenz. El índice de Gini es igual al doble del área de Lorenz. Una población con la curva de Lorenz más cerca de la línea de 45 grados tiene una distribución de ingresos más equitativa. Si todos los ingresos son iguales, la curva de Lorenz degenera a la línea de 45 grados.
Para realizar la curva de Lorenz en R
se utiliza la función svylorenz
. A continuación, se muestran los códigos computacionales para realizar la curva de Lorenz para los ingresos:
library(convey)
svylorenz(formula = ~Income,
design = diseno_gini,
quantiles = seq(0,1,.05),
alpha = .01 )
## $quantiles
## 0 0.05 0.1 0.15 0.2 0.25 0.3
## Income 0 0.006819101 0.01759645 0.03165963 0.04922299 0.06943653 0.09258712
## 0.35 0.4 0.45 0.5 0.55 0.6 0.65
## Income 0.1181331 0.1469261 0.1791978 0.2158231 0.2565784 0.3027002 0.3537989
## 0.7 0.75 0.8 0.85 0.9 0.95 1
## Income 0.4096304 0.4706565 0.5398749 0.6174169 0.7042464 0.8151774 1
##
## $CIs
## , , Income
##
## 0 0.05 0.1 0.15 0.2 0.25 0.3
## (lower 0 0.006189268 0.01644571 0.02973329 0.04643347 0.06564963 0.08770299
## upper) 0 0.007448933 0.01874718 0.03358597 0.05201251 0.07322343 0.09747124
## 0.35 0.4 0.45 0.5 0.55 0.6 0.65
## (lower 0.1120660 0.1396359 0.1705777 0.2056539 0.2447898 0.2898807 0.3397823
## upper) 0.1242001 0.1542163 0.1878180 0.2259923 0.2683671 0.3155197 0.3678154
## 0.7 0.75 0.8 0.85 0.9 0.95 1
## (lower 0.3943025 0.4542246 0.5227820 0.5991455 0.6835287 0.7983336 1
## upper) 0.4249582 0.4870884 0.5569677 0.6356883 0.7249642 0.8320213 1
Los argumentos que requiere la función son, inicialmente, los ingresos de los hogares y el diseño muestral complejo. Adicionalmente, se definen una secuencia de probabilidades que define la suma de los cuantiles a calcular (quantiles) y por último, un número que especifica el nivel de confianza para el gráfico (alpha).