10.1 Modelos multinivel en muestras complejas
En el análisis de los modelos multinivel hay dos tipos de índices que son relevantes:
Los coeficientes de regresión, generalmente denominados como los parámetros fijos del modelo.
Las estimaciones de la varianza, generalmente denominadas parámetros aleatorios del modelo.
Cualquier análisis de regresión multinivel siempre debe comenzar con la estimación de la varianza de los Niveles 1 y 2 para la variable dependiente. El primer paso recomendado en el análisis de regresión multinivel consiste en una descomposición de la varianza de la variable dependiente en los diferentes niveles. Por ejemplo, la varianza del ingreso se descompondrá en dos componentes:
- La varianza dentro del estrato
- la varianza entre los estratos.
Estos dos componentes de varianza se pueden obtener en una regresión multinivel. Ahora bien, un modelo básico está dado por:
\[ y_{ij}=\beta_{0j}+\epsilon_{ij} \] Con,
\[ \beta_{0j}=\gamma_{00}+\tau_{0j} \] Donde,
- \(y_{ij}=\) Los ingresos de la persona \(i\) en el estrato \(j\).
- \(\beta_{0j}=\) El intercepto en el estrato \(j\).
- \(\epsilon_{ij}\) El residual de la persona \(i\) en el estrato \(j\).
- \(\gamma_{00}=\) El intercepto general.
- \(\tau_{0j}=\) Efecto aleatorio para el intercepto.
Para este modelo se asume que,
\[ \tau_{0j}\sim N\left(0,\sigma_{\tau}^{2}\right) \] y,
\[ \epsilon_{ij}\sim N\left(0,\sigma_{\epsilon}^{2}\right) \].
Para poder continuar con las características de este modelo, se introduce un concepto que se denomina correlación intra clásica la cual se calcula como: \[ \rho=\frac{\sigma_{\tau}^{2}}{\sigma_{\tau}^{2}+\sigma_{\epsilon}^{2}} \] La correlación intraclase (ICC, por sus siglas en inglés) hace referencia a la proporción de la varianza total de una variable que se explica por las diferencias entre los grupos (o niveles) en el modelo. En otras palabras, la ICC mide la similitud o correlación entre las observaciones dentro del mismo grupo o nivel en comparación con las observaciones de diferentes grupos.
En un modelo multinivel, los datos están organizados en diferentes niveles, como, por ejemplo, estudiantes dentro de escuelas o pacientes dentro de hospitales. La ICC se calcula para cada nivel de agrupación en el modelo y ayuda a determinar qué tan importante es la variación entre los grupos en comparación con la variación dentro de los grupos.
Una ICC alta indica que una gran proporción de la variación total de la variable se debe a las diferencias entre los grupos, lo que sugiere que los grupos son distintos entre sí y que los efectos de los grupos deben ser considerados en el modelo. Por otro lado, una ICC baja indica que la mayoría de la variación en la variable está dentro de los grupos y que los efectos de los grupos no son tan importantes para explicar la variabilidad en la variable.
Aunque existe evidencia suficiente de que las ponderaciones de muestreo deben usarse en el modelado multinivel (MLM, por sus siglas en inglés) para obtener estimaciones insesgadas5, y también sobre cómo deben usarse estas ponderaciones en los análisis de un solo nivel, hay poca discusión en la literatura sobre qué y cómo usar pesos de muestreo en MLM.
Actualmente, diferentes autores recomiendan diferentes enfoques sobre cómo usar los pesos de muestreo en modelos jerárquicos.
Pfefermann et al. (1998) y Asparouhov (2006) aconsejan utilizar un enfoque de pseudomáxima verosimilitud para calcular estimaciones dentro y entre los diferentes niveles utilizando la técnica de maximización de mínimos cuadrados generalizados ponderados por probabilidad (PWGLS) para obtener estimaciones insesgadas.
Rabe-Hesketh y Skrondal (2006) proporcionan técnicas de maximización de expectativas para maximizar la pseudoverosimilitud.
Cai, T. (2013). Investigation of ways to handle sampling weights for multilevel model analyses. Sociological Methodology, 43(1), 178-219.↩︎