4.3 Relación entre varias variables

En muchos análisis de variables relacionadas con encuestas de hogares no solo basta con analizar el comportamiento de variables de manera individual, por ejemplo, ingresos medios de hombres y mujeres en un país sino también, analizar la diferencia entre los ingresos de los hombres y las mujeres. Esto último con el fin de ir cerrando la brecha salarial que existe. En esta sección se darán las herramientas computacionales para estimar razones y se estudiarán las pruebas de hipótesis para diferencia de medias, junto con contrastes más complejos.

4.3.1 Estimación de razones

Un caso particular de una función no lineal de totales es la razón poblacional. Esta se define como el cociente de dos totales poblacionales de características de interés de tipo continuo. En las encuestas de hogares, en ocasiones se requiere estimar este parámetro, por ejemplo, la razón entre los gastos y los ingresos, la cantidad de hombres por cada mujer o la cantidad de mascotas por cada hogar en un país determinado. Puesto que la razón es un cociente de totales, tanto en numerador como el denominador son cantidades desconocidas y por tanto requieren estimarse. El estimador puntual de una razón en muestreos complejos equivale al cociente de los estimadores de los totales como se define a continuación:

\[ \hat{R}_{\omega} = \frac{\hat{y}_{\omega}}{\hat{x}_{\omega}} \]

Sin embargo, dado que estimador de la razón es un cociente entre dos estimadores, es decir, un cociente de dos variables aleatorias, el cálculo de la estimación de la varianza no es sencillo de obtener. Para ellos, se debe aplicar linealización de Taylor como lo muestra Gutiérrez (2016).

La función survey_ratio tiene implementado los procedimientos para estimar las razones y sus varianzas. Para un correcto cálculo de la estimación de la razón y su varianza estimada se debe introducir en la función el numerador de la razón (numerator) y el denominador (denominator). Adicional a esto, se debe indicar el nivel de confianza de los intervalos. A continuación, se muestran los códigos computacionales para estimar la razón entre el gasto y el ingreso.

diseno %>%
  summarise(Razon =  survey_ratio(
    numerator = Expenditure,
    denominator = Income,
    level = 0.95,
    vartype =  c("se", "ci")
  ))
## # A tibble: 1 × 4
##   Razon Razon_se Razon_low Razon_upp
##   <dbl>    <dbl>     <dbl>     <dbl>
## 1 0.649   0.0232     0.603     0.695

Como se puede observar, la razón entre el gasto y el ingreso se estima en 0.64. Lo que implica que por cada unidad 100 unidades monetarias que le ingrese al hogar, se gastan 64 unidades, consiguiendo un intervalo de confianza al 95% de 0.60 y 0.69. Si el objetivo es estimar la razón entre mujeres y hombres , se realiza de la siguiente manera:

diseno %>%
  summarise(Razon =  survey_ratio(
    numerator = (Sex == "Female"),
    denominator = (Sex == "Male"),
    level = 0.95,
    vartype =  c("se", "ci")
  ))
## # A tibble: 1 × 4
##   Razon Razon_se Razon_low Razon_upp
##   <dbl>    <dbl>     <dbl>     <dbl>
## 1  1.11   0.0351      1.04      1.18

Como la variable sexo en la base de datos es una variable categórica, se tuvo la necesidad de generar las variables indicadores (dummies) para su cálculo; Sex == "Female" para el caso de las mujeres y Sex == "Male" para el caso de los hombres. Los resultados del ejercicio anterior muestran que en la base de datos hay más mujeres que hombres, generando una razón de 1.11. Esto significa que, por cada 100 hombres hay aproximadamente 111 mujeres con un intervalo que varía entre 1.04 y 1.18.

Si se desea hacer la razón de mujeres y hombres pero en la zona rural, se haría de la siguiente manera:

sub_Rural %>%
  summarise(Razon =  survey_ratio(
    numerator = (Sex == "Female"),
    denominator = (Sex == "Male"),
    level = 0.95,
    vartype =  c("se", "ci")
  ))
## # A tibble: 1 × 4
##   Razon Razon_se Razon_low Razon_upp
##   <dbl>    <dbl>     <dbl>     <dbl>
## 1  1.07   0.0352     0.997      1.14

Obteniendo nuevamente que hay más mujeres que hombres. Ahora bien, otro análisis de interés es estimar la razón de gastos pero solo en la población femenina. A continuación, se presentan los códigos computacionales.

sub_Mujer %>%
  summarise(Razon =  survey_ratio(
    numerator = Expenditure,
    denominator = Income,
    level = 0.95,
    vartype =  c("se", "ci")
  ))
## # A tibble: 1 × 4
##   Razon Razon_se Razon_low Razon_upp
##   <dbl>    <dbl>     <dbl>     <dbl>
## 1 0.658   0.0199     0.619     0.698

Dando como resultado que por cada 100 unidades monetarias que le ingresan a las mujeres se gastan 65 con un intervalo de confianza entre 0.61 y 0.69. Por último, análogamente para los hombres, la razón de gastos resulta muy similar que para las mujeres.

sub_Hombre %>%
  summarise(Razon =  survey_ratio(
    numerator = Expenditure,
    denominator = Income,
    level = 0.95,
    vartype =  c("se", "ci")
  ))
## # A tibble: 1 × 4
##   Razon Razon_se Razon_low Razon_upp
##   <dbl>    <dbl>     <dbl>     <dbl>
## 1 0.639   0.0288     0.582     0.696

4.3.2 Prueba de hipótesis para la diferencia de medias

Se le llama prueba de hipótesis a un procedimiento estadístico utilizado para evaluar la evidencia en favor o en contra de una afirmación o suposición acerca de una población. En este proceso, se plantea una hipótesis nula (\(H_0\)), que representa la afirmación inicial que debe ser probada, y una hipótesis alternativa (\(H_1\)), que es la afirmación contraria a la hipótesis nula. Esta afirmación puede estar basada en alguna creencia o experiencia pasada que será contrastada con la evidencia que se obtengan a través de la información contenida en la muestra. Si se sospecha que el parámetro \(\theta\) es igual a cierto valor particular \(\theta_{0}\), las posible combinaciones de hipótesis que se pueden contrastar son:

\[\begin{eqnarray*} \begin{cases} H_{0}: & \theta=\theta_{0}\\ H_{1}: & \theta\neq\theta_{0} \end{cases}\,\,\,\,\,\,\,\,\, \begin{cases} H_{0}: & \theta=\theta_{0}\\ H_{1}: & \theta>\theta_{0} \end{cases}\,\,\,\,\,\,\,\,\, \begin{cases} H_{0}: & \theta=\theta_{0}\\ H_{1}: & \theta<\theta_{0} \end{cases} \end{eqnarray*}\]

Se dirá que una de las dos hipótesis es cierta sólo si la evidencia estadística, la cual es obtenida de la muestra, la apoya. El proceso por medio del cual se escoge una de las dos hipótesis es llamado Prueba de Hipótesis.

En términos generales, algunos parámetros importantes se pueden escribir como una combinación lineal de medidas de interés. Los casos más usuales son diferencias de medias, sumas ponderadas de medias utilizadas para construir índices económicos, etc. De esta forma, considere una función que es una combinación lineal de \(j\) estadísticas descriptivas como se muestra a continuación:

\[\begin{eqnarray*} f\left(\theta_{1},\theta_{2},...,\theta_{j}\right) & = & \sum_{j=1}^{J}a_{j}\theta_{j} \end{eqnarray*}\]

En \(a_{j}\) son constantes conocidas. Un estimador de esta función está dado por:

\[\begin{eqnarray} \hat{f}_{\omega}\left(\hat{\theta}_{1},\hat{\theta}_{2},...,\hat{\theta}_{j}\right) & = & \sum_{j=1}^{J}a_{j}\hat{\theta}_{j} \end{eqnarray}\]

Y su varianza se calcula como sigue:

\[\begin{eqnarray} var\left(\sum_{j=1}^{J}a_{j}\hat{\theta}_{j}\right) & = & \sum_{j=1}^{J}a_{j}^{2}var\left(\hat{\theta}_{j}\right)+2\times\sum_{j=1}^{J-1}\sum_{k>j}^{J}a_{j}a_{k}\,cov\left(\hat{\theta}_{j},\hat{\theta}_{k}\right) \end{eqnarray}\]

Como se pudo observar en la ecuación de la varianza del estimador, esta incorpora las varianzas de las estimaciones de todos los componentes individuales, así como las covarianzas de los pares estimados.

Es de nuestro particular interés analizar la diferencia de medias poblacionales, que se puede escribir como sigue:

\[ \bar{y}^{1}-\bar{y}^{2} \]

En donde, \(\bar{y}_{1}\) es la media de la primera población, por ejemplo, ingresos medios en los hogares obtenido por los padres de familia y \(\bar{y}_{2}\) es la media de la segunda población, que para seguir el ejemplo serían, los ingresos medios de las madres en un hogar. Este parámetro puede ser estimado insesgadamente por:

\[ \hat{\bar{y}}_{\omega}^{1}-\hat{\bar{y}}_{\omega}^{2} \]

En donde \(\hat{\bar{y}}_{\omega}^{i}\) es el estimador de muestreo de \(\bar{y}^{i}\) (\(i = 1, 2.\)). Considerando el parámetro de interés en esta sección, las hipótesis a estudiar serían las siguientes:

\[\begin{eqnarray*} \begin{cases} H_{0}:\bar{y}_{1}-\bar{y}_{2}=0\\ H_{1}:\bar{y}_{1}-\bar{y}_{2}\neq0 \end{cases} & \begin{cases} H_{0}:\bar{y}_{1}-\bar{y}_{2}=0\\ H_{1}:\bar{y}_{1}-\bar{y}_{2}>0 \end{cases} & \begin{cases} H_{0}:\bar{y}_{1}-\bar{y}_{2}=0\\ H_{1}:\bar{y}_{1}-\bar{y}_{2}<0 \end{cases} \end{eqnarray*}\]

Para probar estas hipótesis se utiliza el siguiente estadístico de prueba, el cual tiene distribución t-student con \(gl\) grados de libertad, los cuales están dados por la diferencia entre el número de UPM y el número de estratos.

\[ t = \frac{\hat{\bar{y}}_{\omega}^{1}-\hat{\bar{y}}_{\omega}^{2}}{se\left(\bar{y}_{1}-\bar{y}_{2}\right)} \sim t_{gl} \]

donde,

\[ \widehat{se}\left(\hat{\bar{y}}_{\omega}^{1}-\hat{\bar{y}}_{\omega}^{2}\right) = \sqrt{\widehat{var}\left(\hat{\bar{y}}_{\omega}^{1}\right) + \widehat{var}\left(\hat{\bar{y}}_{\omega}^{2}\right) - 2 \ \widehat{cov}\left(\hat{\bar{y}}_{\omega}^{1},\hat{\bar{y}}_{\omega}^{2}\right)} \]

Si se desea construir un intervalo de confianza para la diferencia de media se realizaría de la siguiente manera:

\[ \hat{\bar{y}}_{\omega}^{1}-\hat{\bar{y}}_{\omega}^{2} \pm t_{gl}\ \widehat{se}\left(\hat{\bar{y}}_{\omega}^{1}-\hat{\bar{y}}_{\omega}^{2}\right) \]

Para poder llevar a cabo la prueba de hipótesis para la diferencia de media de los ingresos en un hogar por sexo, tomemos la base de datos que tenemos como ejemplo. La función que se encarga de realizar la prueba es svyttest y solo requiere como argumentos la variable ingreso (o variable de interés), la variable sexo (variable discriminadora), el diseño muestral y el nivel de confianza. A continuación, se muestran los códigos computacionales que se requieren:

svyttest(Income ~ Sex, design = diseno, level = 0.95) 
## 
##  Design-based t-test
## 
## data:  Income ~ Sex
## t = 1.3625, df = 118, p-value = 0.1756
## alternative hypothesis: true difference in mean is not equal to 0
## 95 percent confidence interval:
##  -12.82205  69.38503
## sample estimates:
## difference in mean 
##           28.28149

En esta salida podemos observar que el p-valor de la prueba es 0.17. Si tomamos una significancia del 5% para la prueba se puede concluir que, con una confianza del 95% y basados en la muestra, no existe suficiente evidencia estadística para decir que los ingresos medios en los hogares son diferentes por sexo. Por otro lado, el intervalo de confianza al 95% para la diferencia de medias entre los ingresos de hombres y mujeres es \(\left(-12.8,\,69.3\right)\).

Si ahora el objetivo es realizar la prueba de diferencia de medias para los ingresos entre hombres y mujeres pero solo en la zona urbana, los códigos computacionales son los siguientes:

svyttest(Income ~ Sex, design = sub_Urbano, level = 0.95) 
## 
##  Design-based t-test
## 
## data:  Income ~ Sex
## t = 1.5667, df = 63, p-value = 0.1222
## alternative hypothesis: true difference in mean is not equal to 0
## 95 percent confidence interval:
##  -12.31754 101.74023
## sample estimates:
## difference in mean 
##           44.71134

En donde, al igual que el anterior, no se rechaza la hipótesis nula con una confianza del 95%. Por otro lado, la función svyttest permite usar filtros. Si se requiere probar la hipótesis de diferencia de medias de ingresos por sexo pero solo en aquellas personas del hogar mayores a 18 años, se utilizará dentro de la función svyttest la función filter como se muestra a continuación:

svyttest(Income ~ Sex,
         design = diseno %>% filter(Age > 18),
         level = 0.95)
## 
##  Design-based t-test
## 
## data:  Income ~ Sex
## t = 1.5263, df = 118, p-value = 0.1296
## alternative hypothesis: true difference in mean is not equal to 0
## 95 percent confidence interval:
##  -10.72746  82.85253
## sample estimates:
## difference in mean 
##           36.06253

y con una confianza del 95% y basado en la muestra tampoco se rechaza la hipótesis hula. Es decir, no existe evidencia estadística para concluir que los ingresos medios entre hombres y mujeres mayores de 18 años son diferentes.

4.3.3 Contrastes

En muchas ocasiones, se requiere comparar más de dos poblaciones al mismo tiempo; por ejemplo, comparar los ingresos medios de los hogares en tres regiones con el fin de identificar aquellas regiones donde hubo un mayor impacto en los hogares. En casos como estos la diferencia de medias que estudiamos en capítulos anteriores no es suficiente dado que permite solo comprar parejas de poblaciones y por ende que, hacer contraste resulta una muy buena alternativa para abordar este tipo de problemas.

Recurriendo en las definiciones que se han trabajado en este capítulo, un contraste es una combinación lineal de parámetros de la forma:

\[\begin{eqnarray*} f = A * \theta = f\left(\theta^{1},\theta^{2},...,\theta^{j}\right) & = & \sum_{j=1}^{J}a_{j}\theta^{j} \end{eqnarray*}\]

En donde \(A\) es una matriz o vector de constantes y \(\theta\) es una matriz o vector de parámetros. Los procedimientos metodológicos para implementar los contrastes en diseños de muestreo complejos están desarrolladas en la función svycontrast. A continuación, se muestra el uso de dicha función para el cálculo de contraste en la base de datos de ejemplo, comparando el promedio de ingresos por región. Como primer ejemplo, se realizará la comparación de dos poblaciones, las regiones Norte y Sur. En particular, es de interés la diferencia de ingresos (\(f = \bar{y}^{Norte} - \bar{y}^{Sur}\)). Puesto que la población tiene cinco regiones y solo se construirá el contraste para dos de ellas (la región Norte y la región Sur), este queda definido de la siguiente manera:

\[\begin{eqnarray*} f = A * \theta = 1\times{\bar{y}}^{Norte}+\left(-1\right)\times{\bar{y}}^{Sur}+0\times{\bar{y}}^{Centro}+0\times{\bar{y}}^{Occidente}+0\times{\bar{y}}^{Oriente} \end{eqnarray*}\]

Como se puede observar, en este caso el vector de contraste es \(A = \left[1,\,-1,\,0,\,0,\,0\right]\). De forma matricial, el estimador de este contraste específico queda definido de la siguiente manera:

\[\begin{eqnarray*} \hat{f}_{\omega} = A * \hat{\theta} = \left[1,\,-1,\,0,\,0,\,0\right]\times\left[\begin{array}{c} \hat{\bar{y}}^{Norte}_{\omega}\\ \hat{\bar{y}}^{Sur}_{\omega}\\ \hat{\bar{y}}^{Centro}_{\omega}\\ \hat{\bar{y}}^{Occidente}_{\omega}\\ \hat{\bar{y}}^{Oriente}_{\omega} \end{array}\right] \end{eqnarray*}\]

Ahora bien, para realizar procesos de la construcción del estimador del contraste y su varianza estimada paso a paso se procede a calcular las medias estimadas por región con la función svyby como se muestra a continuación:

prom_region <- svyby(
  formula = ~ Income,
  by = ~ Region,
  design = diseno,
  FUN = svymean,
  na.rm = T,
  covmat = TRUE,
  vartype = c("se", "ci")
)

prom_region
##              Region   Income       se     ci_l     ci_u
## Norte         Norte 552.3637 55.35987 443.8603 660.8670
## Sur             Sur 625.7740 62.40574 503.4610 748.0870
## Centro       Centro 650.7820 61.46886 530.3053 771.2588
## Occidente Occidente 517.0071 46.22077 426.4161 607.5982
## Oriente     Oriente 541.7543 71.66487 401.2938 682.2149

La función svyby permite aplicar una función, en este caso la media (svymean) por región (by) utilizando el diseño muestral complejo de la encuesta (design). Las demás componentes de la función ya se han utilizado previamente. Como resultado de aplicar esta función se obtienen las medias estimadas de los ingresos por región. Para continuar con el ejemplo, se tomarán solo los ingresos medios estimados de las regiones Norte y Sur y calcularemos su diferencia:

# Paso 1: diferencia de estimaciones (Norte - Sur) 
552.4 - 625.8
## [1] -73.4

El paso siguiente es calcular la matriz de varianzas y covarianzas y de allí extraer las varianzas y covarianzas de las regiones Norte y Sur:

# Paso 2: Matriz de varianzas y covarianzas
vcov(prom_region)
##              Norte      Sur  Centro Occidente  Oriente
## Norte     3064.715    0.000    0.00     0.000    0.000
## Sur          0.000 3894.476    0.00     0.000    0.000
## Centro       0.000    0.000 3778.42     0.000    0.000
## Occidente    0.000    0.000    0.00  2136.359    0.000
## Oriente      0.000    0.000    0.00     0.000 5135.854

Como el muestreo es independiente en cada región, las covarianzas en la anterior matriz son nulas. Para calcular el error estándar de la diferencia (contraste) se usará las propiedades de la varianza, puesto que:

\[ se(\hat{f}_{\omega}) = se\left(\hat{\bar{y}}^{Norte}_{\omega}-\hat{\bar{y}}^{Sur}_{\omega}\right)=\sqrt{var\left(\hat{\bar{y}}^{Norte}_{\omega}\right)+var\left(\hat{\bar{y}}^{Sur}_{\omega}\right)-2\,cov\left(\hat{\bar{y}}^{Norte}_{\omega},\hat{\bar{y}}^{Sur}_{\omega}\right)} \]

Por tanto, tenemos que el error estándar estimado para este contraste es:

sqrt(3065 + 3894 - 2 * 0)
## [1] 83.42062

Ahora bien, la función svycontrast devuelve el contraste estimado y su error estándar. Los argumentos de esta función son los promedios de los ingresos estimados (stat) y las constantes de contraste (contrasts). Se obtiene como resultado que la diferencia de los ingresos medios se estima en 73.4 unidades monetarias con un error estándar de 83.42 unidades.

svycontrast(stat = prom_region, 
            contrasts = list(diff_NS = c(1, -1, 0, 0, 0)))
##         contrast     SE
## diff_NS   -73.41 83.422

Por otro lado, es posible ampliar la estructura de los contrastes. Por ejemplo, considere que se quieren estimar los siguientes contrastes:

  • \(\bar{y}^{Norte} - \bar{y}^{Centro}\),
  • \(\bar{y}^{Sur}-\bar{y}^{Centro}\),
  • \(\bar{y}^{Occidente}-\bar{y}^{Oriente}\)

En este caso, la matriz de contrastes escrita de forma matricial tendría la siguiente estructura:

\[ A = \left[\begin{array}{ccccc} 1 & 0 & -1 & 0 & 0\\ 0 & 1 & -1 & 0 & 0\\ 0 & 0 & 0 & 1 & -1 \end{array}\right] \]

Ahora, aplicando la función svycontrast en R se obtiene:

svycontrast(
  stat = prom_region,
  contrasts = list(
    Norte_sur = c(1, 0,-1, 0, 0),
    Sur_centro = c(0, 1,-1, 0, 0),
    Occidente_Oriente = c(0, 0, 0, 1,-1)
  )
)
##                   contrast     SE
## Norte_sur          -98.418 82.723
## Sur_centro         -25.008 87.595
## Occidente_Oriente  -24.747 85.277

También es posible construir contrastes en dominios que estén correlacionadas. Por ejemplo, Ingreso y Sexo. Como se hizo en el ejemplo anterior, se inicia con el promedio estimado por sexo.

prom_sexo <- svyby(
  formula = ~ Income,
  by = ~ Sex,
  design = diseno,
  FUN = svymean,
  na.rm = T,
  covmat = TRUE,
  vartype = c("se", "ci")
)

prom_sexo
##           Sex   Income       se     ci_l     ci_u
## Female Female 557.5681 25.82995 506.9423 608.1939
## Male     Male 585.8496 34.58759 518.0592 653.6400

Si el contraste de interés es \(\theta = \bar{y}^{F} - \bar{y}^{M}\), entonces usando la función svycontrast se obtiene el contraste estimado, junto con su error estándar, obteniendo como resultado que, en promedio, los hombres obtienen 28.3 unidades monetarias más que las mujeres con una error estándar de 20.76.

svycontrast(stat = prom_sexo,
            contrasts = list(diff_Sexo = c(1,-1)))
##           contrast     SE
## diff_Sexo  -28.281 20.756

Más aún, otra posibilidad es poder obtener resultados agregados, por ejemplo, con sumas de totales en regiones:

\[ \hat{f}_{\omega}=\hat{y}^{Norte}_{\omega}+\hat{y}^{Sur}_{\omega} +\hat{y}^{Centro}_{\omega} \]

En este caso, se crea la función adecuada con sumas de totales por regiones

sum_region <- svyby(
  ~ Income,
  ~ Region,
  diseno,
  svytotal,
  na.rm = T,
  covmat = TRUE,
  vartype = c("se", "ci")
)

sum_region
##              Region   Income      se     ci_l     ci_u
## Norte         Norte 14277323 1507575 11322530 17232115
## Sur             Sur 16068151 1877989 12387359 19748942
## Centro       Centro 16483319 2383556 11811634 21155003
## Occidente Occidente 16853540 1823807 13278944 20428135
## Oriente     Oriente 22111335 2833460 16557856 27664814

Para este caso en particular, la matriz de contraste queda como: \[ \left[\begin{array}{cccccc} 1 & 1 & 1 & 0 & 0 \end{array}\right] \]

Una vez más, el procedimiento en R es como sigue:

svycontrast(stat = sum_region,
            contrasts = list(Agregado_NCS = c(1, 1, 1, 0, 0))) 
##              contrast      SE
## Agregado_NCS 46828792 3388357

Por último, si se desean obtener los promedios por categorías. Por ejemplo:

\[ \hat{f} = \hat{\bar{y}}_{Edad} = \frac{1}{J}\sum_{j=1}^J\hat{\bar{y}}_{j} \]

donde \(K\) es el número de categorías de la variable. En R se hace de la siguiente manera:

prom_edad <- svyby(
  formula = ~ Income,
  by = ~ CatAge,
  design =  diseno,
  FUN = svymean,
  na.rm = T,
  covmat = TRUE
)

prom_edad
##              CatAge   Income       se
## 0-5             0-5 463.7715 28.86795
## 6-15           6-15 511.6179 34.88031
## 16-30         16-30 607.2917 37.41561
## 31-45         31-45 573.4167 26.94744
## 46-60         46-60 763.0610 58.97170
## Más de 60 Más de 60 466.6133 31.20795

Cuyo vector de contraste estaría dada por:

\[ A = \left[\begin{array}{cccccc} \frac{1}{6} & \frac{1}{6} & \frac{1}{6} & \frac{1}{6} & \frac{1}{6} & \frac{1}{6} \end{array}\right] \]

El procedimiento en R es:

svycontrast(stat = prom_edad,
            contrasts = list(agregado_edad =
                               rep(1 / 6, times = 6)))
##               contrast     SE
## agregado_edad    564.3 25.404

También es posible realizar contrastes con parámetros más complejos, como por ejemplo razones. Considere la diferencia por sexo entre las razones de gastos contra ingresos. En primer lugar se debe crear la función que permita estimar las razones por sexo:

razon_sexo <- svyby(
  formula = ~ Income,
  by = ~ Sex,
  denominator = ~ Expenditure,
  design = diseno,
  FUN = svyratio,
  na.rm = T,
  covmat = TRUE,
  vartype = c("se", "ci")
)

razon_sexo
##           Sex Income/Expenditure se.Income/Expenditure     ci_l     ci_u
## Female Female           1.519060            0.04582607 1.429243 1.608878
## Male     Male           1.564762            0.07044239 1.426698 1.702827

Luego, la estimación de la diferencia de razones, estaría dada por el siguiente contraste, en donde se puede concluir que la diferencia de las razones es estimada en 0.045 en favor de los hombres.

svycontrast(stat = razon_sexo,
            contrasts = list(diff_sexo = c(1,-1))) 
##            contrast     SE
## diff_sexo -0.045702 0.0416

References

———. 2016. Estrategias de muestreo: diseño de encuestas y estimación de parámetros. Segunda edición. Ediciones de la U.