18.3 Estimación de las matrices de transición

Considere que se dispone de información sobre la situación laboral de 41274 personas para los dos primeros trimestres del 2020 (año en el que la pandemia por COVID-19 produjo alteraciones importantes en el levantamiento regular de las encuestas y en el mercado de trabajo). La clasificación del estatus ocupacional en la muestra se da en la siguiente tabla; la cual contiene los complementos columna y los complementos fila para las personas que no respondieron en alguno de los dos períodos. Nótese que los valores del complemento fila son mucho mayores que el complemento columna, lo que puede ser causado por la pandemia. Nótese que la suma de todas las entradas de la tabla de clasificación da como resultado el número de personas en la muestra traslapada, es decir 41,274 individuos.

Distribución observada de los flujos brutos en la muestra no ponderada con ausencia de respuesta en ambos periodos.
Estado (T1/T2) Formal Informal Desocupado Inactivo Complemento fila
Formal 11483 718 592 1828 451
Informal 703 2513 495 2769 198
Desocupado 191 181 503 794 81
Inactivo 364 641 388 15386 382
Complemento columna 160 65 48 257 83

Como se supone que la muestra proviene de un muestreo complejo sobre la población del país, para utilizar el método de estimación propuesto en esta sección, se necesita primero estimar el tamaño de la población en cada celda de la tabla anterior. Estas estimaciones se dan en la siguiente tabla donde el tamaño de población estimado es 15,597,572.

Distribución poblacional estimada de los flujos brutos ausencia de respuesta en ambos periodos.
Estado (T1/T2) Formal Informal Desocupado Inactivo Complemento fila
Formal 3,269,673 201,639 175,719 503,740 155,902
Informal 232,095 641,565 146,416 725,006 58,649
Desocupado 55,243 50,337 157,642 233,597 26,695
Inactivo 102,490 161,363 98,898 4,299,066 118,393
Complemento columna 47,104 26,276 19,746 100,775 25,545

La escogencia del mejor modelo se llevó a cabo utilizando la estadística de ajuste \(\chi^2\), calculada sobre la distancia entre los valores observados y los valores predichos por el modelo. En estos términos, el mejor modelo fue el C, puesto que minimizaba esta distancia con un valor de \(\chi^2 = 0,706\). La distribución nula del estadístico es chi-cuadrado con \(G^2-D\) grados de libertad, con \(D\) indicando el número de parámetros estimados. Para el conjunto de datos considerado en este documento, la siguiente tabla presenta los valores críticos de la distribución nula y los valores del estadístico de prueba para cada modelo. Se concluye que el modelo más apropiado para el conjunto de datos es el modelo C.

Ajuste de los cuatros modelos.
Modelo A Modelo B Modelo C Modelo D
Grados de libertad 7 4 1 1
Valor crítico 14.07 9.49 3.84 3.84
Valor \(\chi^2_{RS}\) 15.6706 18.3659 0.2418 3.9137

Recuérdese que este modelo considera que la probabilidad inicial de que un individuo sea respondiente en el primer trimestre de 2020 es la misma para todas las clasificaciones contempladas en la encuesta, es decir \(\psi(i,j)=\psi\). Sin embargo, las probabilidades de transición entre respondientes y no respondientes dependerán de la clasificación del individuo en el primer trimestre de 2020; es decir \(\rho_{MM}(i,j)=\rho_{MM}(i)\) y \(\rho_{RR}(i,j)=\rho_{RR}(i)\). Bajo estos supuestos, la siguiente tabla ilustra la estimación poblacional, insesgada con respecto al diseño de muestreo complejo de la encuesta, de los cambios brutos para el nivel de ocupación.

Distribución poblacional estimada de los flujos brutos para el proceso no observable (sin ausencia de respuesta) en ambos periodos bajo el modelo C. Los errores estándar se muestran en paréntesis.
Estado (T1/T2) Formal Informal Desocupado Inactivo
Formal 4.627.632 (102.470) 287.124 (18.979) 252.084 (20.399) 713.284 (30.358)
Informal 327.066 (33.292) 911.996 (45.645) 210.372 (16.508) 1.022.351 (50.332)
Desocupado 79.346 (10.592) 72.944 (8.858) 230.949 (21.180) 335.746 (28.023)
Inactivo 143.303 (11.192) 227.545 (15.849) 140.923 (10.550) 6.014.907 (123.559)

El modelo C considera que los parámetros de la primera etapa del proceso (no observable) están definidos como las probabilidades de transición de una clasificación a otra en los periodos de observación. Estas estimaciones definen las matrices de transición laboral, que para los periodos estudiados corresponden a las entradas de la siguiente tabla. En particular se resalta el hecho de que el 12,1% de los trabajadores formales pasaron directamente a la inactividad; mientras que el cambio fue mayor en los trabajadores informales y en los desocupados, de los cuales el 41,3% y el 46,6% pasaron a la inactividad, respectivamente. Además, en los periodos estudiados, el 92,1% de los individuos inactivos siguió en este estado.

Estimación de las matrices de transición laboral en ambos periodos bajo el modelo C. Los errores estándar se muestran en paréntesis.
Estado (T1/T2) Formal Informal Desocupado Inactivo
Formal 0.787 (0.010) 0.048 (0.003) 0.042 (0.003) 0.121 (0.004)
Informal 0.132 (0.012) 0.368 (0.013) 0.085 (0.005) 0.413 (0.013)
Desocupado 0.110 (0.012) 0.101 (0.010) 0.321 (0.021) 0.466 (0.025)
Inactivo 0.021 (0.001) 0.034 (0.002) 0.021 (0.001) 0.921 (0.010)

Por otro lado, las probabilidades iniciales de clasificación en el primer periodo de interés se encuentran en la siguiente tabla, en la que también se observan las probabilidades de transición de los no respondientes y las probabilidades de transición de los respondientes, diferenciadas por condición de ocupación en el primer trimestre de 2020. Nótese que la probabilidad inicial de respuesta se estimó en \(\hat{\psi}=0.981 (0.002)\) para todas las clasificaciones de la condición de ocupación. Se puede notar que, dado que \(1-\hat{\rho}_{MM}\) indica la probabilidad de que un individuo responda en el segundo trimestre de 2020 dado que no respondió en el primer trimestre de 2020, condicionado a cada condición de ocupación, entonces las personas informales e inactivas son más propensos a no responder en ambos periodos, por lo que habría indicios de un patrón de ausencia de respuesta no ignorable que el modelo ha logrado identificar correctamente.

Estimación de los demás parámetros del modelo C. Los errores estándar se muestran en paréntesis.
Trimestre I-2020 \(\hat{\eta}\) \(\hat{\rho}_{RR}\) \(\hat{\rho}_{MM}\)
Formal 0.376 (0.004) 0.963 (0.004) 0.304 (0.104)
Informal 0.158 (0.003) 0.967 (0.004) 0.000 (0.261)
Desocupado 0.046 (0.002) 0.949 (0.008) 0.000 (0.188)
Inactivo 0.418 (0.004) 0.975 (0.002) 0.017 (0.086)

Por último, sería deseable establecer si hay diferencias importantes en el impacto que la pandemia causó en el mercado laboral entre hombre y mujeres. Para realizar estas comparaciones se ajustó el modelo C en cada una de las subpoblaciones, encontrando ajustes precisos y satisfactorios con \(\chi^2_{hombres} = 0,350\) y \(\chi^2_{hombres} = 0,470\). La estimación de la probabilidad inicial de respuesta en ambos casos se calculó en \(\hat{\psi}=0.981 (0.002)\), y las estimaciones de las probabilidades \(\hat{\eta}\) y \(\hat{\rho}_{RR}\) no tuvieron cambios significativos entre los grupos. Sin embargo, la estimación de las probabilidades \(\hat{\rho}_{MM}\) mostró diferencias entre hombres y mujeres que fueron clasificados como trabajadores formales y inactivos en el primer trimestre del 2020. En particular, para el grupo de trabajadores formales, \(\hat{\rho}_{MM}^{hombre} = 0,253\), mientras que \(\hat{\rho}_{MM}^{mujer} = 0,331\), lo cual indica que las mujeres formales eran más propensas a no responder en el segundo trimestre de 2020, comparadas con los hombres. Por otro lado, para el grupo de inactivos, \(\hat{\rho}_{MM}^{hombre} = 0,112\), mientras que \(\hat{\rho}_{MM}^{mujer} = 0,000\), lo cual indica que las mujeres desocupadas definitivamente tuvieron una menor probabilidad a no responder en el segundo trimestre de 2020 que los hombres.

La estimación de las matrices de transición para ambos subgrupos poblacionales se muestra en las siguientes tablas. Es importante resaltar que, según las estimaciones resultantes de este análisis, la peor parte se la llevaron las mujeres. Nótese que, para los trabajadores formales, existe una diferencia importante entre hombres y mujeres, siendo los primeros los menos afectados al pasar a la inactividad: 10,2% para los hombres, 14,5% para las mujeres. Este mismo fenómeno se presenta con más fuerza en el grupo de los trabajadores informales, en donde el 36,2% de los hombres pasó a la inactividad, mientras que el 46,9% de las mujeres pasó a la inactividad. De la misma forma, dentro de los individuos desocupados, un mayor porcentaje de mujeres pasó de la desocupación a la inactividad: 39,2% de hombres, contra un 53,4% de mujeres. Finalmente, el porcentaje de personas que siguió en la inactividad es mayor en las mujeres: 90,2% para los hombres, frenta a un 93,1% para las mujeres.

Estimación de las matrices de transición laboral para los hombres bajo el modelo C. Los errores estándar se muestran en paréntesis.
\(p_{ij}\) (Hombres) Formal Informal Desocupado Inactivo
Formal 0.791 (0.013) 0.056 (0.004) 0.049 (0.005) 0.102 (0.005)
Informal 0.138 (0.011) 0.403 (0.018) 0.095 (0.008) 0.362 (0.017)
Desocupado 0.146 (0.025) 0.118 (0.017) 0.343 (0.031) 0.392 (0.037)
Inactivo 0.031 (0.004) 0.036 (0.003) 0.030 (0.003) 0.902 (0.021)
Estimación de las matrices de transición laboral para las mujeres bajo el modelo C. Los errores estándar se muestran en paréntesis.
\(p_{ij}\) (Mujeres) Formal Informal Desocupado Inactivo
Formal 0.781 (0.010) 0.039 (0.003) 0.033 (0.003) 0.145 (0.007)
Informal 0.125 (0.012) 0.331 (0.017) 0.073 (0.007) 0.469 (0.018)
Desocupado 0.078 (0.012) 0.086 (0.012) 0.301 (0.028) 0.534 (0.036)
Inactivo 0.017 (0.001) 0.034 (0.002) 0.017 (0.001) 0.931 (0.013)