11.3 Linealización de Taylor

Cuando se trata de estimar parámetros que tienen una forma no lineal, es posible recurrir al uso de las herramientas del análisis matemático para aproximar sus varianzas con el fin de publicar las cifras oficiales con sus respectivos errores estándar. Valliant, Dever, y Kreuter (2013) mencionan que esta técnica se basa en expresar el estimador como función de estimadores lineales de totales. Por ejemplo, si el interés recae en estimar un parámetro poblacional \(\theta\) que a su vez depende de \(Q\) estimadores de totales \((t_1, t_2, \ldots, t_Q)\), entonces su estimador de muestreo se debe expresar como \(\hat{\theta}=f(\hat{t}_1, \ldots, \hat{t}_Q)\).

En donde \(\hat{t}_j=\sum_{k\in s}w_k y_{jk}\) es un estimador del \(j\)-ésimo total. Por consiguiente, si el estimador de interés no es una función lineal de totales, entonces las propiedades estadísticas comunes como insesgamiento, eficiencia y precisión de los estimadores deben ser aproximadas. Es común usar la técnica de la linealización de Taylor para encontrar aproximaciones lineales de primer orden. H. A. Gutiérrez (2016, capitulo 8) presenta una explicación detallada de esta técnica aplicada a diferentes escenarios de estimación, en donde se consideran los siguientes pasos para construir un estimador linealizado de la varianza de una función no lineal de totales:

  1. Expresar el estimador del parámetro de interés \(\hat{\theta}\) como una función de estimadores de totales insesgados. Así, \[ \hat{\theta}=f(\hat{t}_1, \hat{t}_2,\ldots,\hat{t}_Q). \]
  2. Determinar todas las derivadas parciales de \(f\) con respecto a cada total estimado \(\hat{t}_{q}\) y evaluar el resultado en las cantidades poblacionales \(t_q\). Así \[ a_q=\left.\dfrac{\partial f(\hat{t}_1,\ldots,\hat{t}_Q)}{\partial \hat{t}_{q}}\right|_{\hat{t}_1=t_1,\ldots,\hat{t}_Q=t_Q} \]
  3. Aplicar el teorema de Taylor para funciones vectoriales para linealizar la estimación \(\hat{\theta}\) con \(\mathbf{a}=(t_1,t_2,\cdots,t_Q)'\). En el paso anterior, se vio que \(\bigtriangledown\hat{\theta}=(a_1,\cdots,a_Q)\). Por consiguiente se tiene que \[ \hat{\theta}=f(\hat{t}_1,\ldots,\hat{t}_Q) \cong \theta +\sum_{q=1}^Qa_q(\hat{t}_{q}-t_q) \]
  4. Definir una nueva variable \(E_k\) con \(k\in s\) al nivel de cada elemento observado en la muestra aleatoria, así: \[ E_k=\sum_{q=1}^Qa_qy_{qk} \]
  5. Si los estimadores \(\hat{t}_{q}\) son estimadores de Horvitz-Thompson, una expresión que aproxima la varianza de \(\hat{\theta}\) está dada por \[ AVar(\hat{\theta})=Var\left(\sum_{q=1}^Qa_q\hat{t}_{q,\pi}\right) =Var\left(\sum_S\frac{E_k}{\pi_k}\right)=\sum_U\sum_U\Delta_{kl}\frac{E_k}{\pi_k}\frac{E_l}{\pi_l}. \]

Tal como se advirtió anteriormente, H. A. Gutiérrez (2016) afirma que, para encontrar una estimación de la varianza de \(\hat{\theta}\), no es posible utilizar directamente los valores \(E_k\), porque éstos dependen de los totales poblacionales (las derivadas \(a_q\) se evalúan en los totales poblacionales que son desconocidos). Por consiguiente, los valores \(E_k\) se aproximan reemplazando los totales desconocidos por los estimadores de los mismos. Siendo \(e_k\) la aproximación de la variable linealizada dada por \[ e_k=\sum_{q=1}^Q\hat{a}_qy_{qk} \]

donde \(\hat{a}_q\) corresponde a un estimador de \(a_q\). La aproximación de Taylor para el estimador la varianza del estimador de Horvitz-Thompson para un total está dado por la siguiente expresión

\[ \widehat{Var}(\hat{t}_{y,\pi})=\sum\sum_S \dfrac{\Delta_{kl}}{\pi_{kl}}\frac{e_k}{\pi_k}\frac{e_l}{\pi_l} \]

Por ejemplo, bajo este contexto, si se quisiera estimar la tasa de desocupación (función no lineal de totales) definida como el cociente entre el total poblacional de personas que se encuentran en edad laboral pero que carecen de un empleo \(({t}_{y})\) sobre la cantidad de personas que pertenecen a la población económicamente activa \(({t}_{z})\), entonces, la estimación de la aproximación de la varianza del estimador de esta razón \(\hat{\theta}=\dfrac{\hat{t}_{y,\pi}}{\hat{t}_{z,\pi}}\) estaría definida como sigue en términos de las variables linealizadas \[ e_k=\dfrac{1}{\hat{t}_{z,\pi}}(y_k-\hat{\theta}z_k) \]

Si, además, el muestreo de la encuesta es bietápico con selección aleatoria simple sin reemplazo en cada etapa, entonces este estimador de la varainza tomaría la siguiente forma:

\[ \widehat{Var}(\hat{\theta})=\frac{N_{I}^2}{n_{I}}\left(1-\frac{n_{I}}{N_{I}}\right)S^2_{\hat{t}_{e}S_I}+ \frac{N_{I}}{n_{I}}\sum_{i\in S_{I}}\frac{N_i^2}{n_i}\left(1-\frac{n_i}{N_i}\right)S^2_{e_{S_i}} \]

En donde \(S^2_{\hat{t}_{e}S_I}\) es la varianza muestral de los totales estimados \(t_{ei}\) de las UPM seleccionadas en la primera etapa del muestreo y \(S^2_{e_{S_i}}\) es la varianza muestral entre los valores \(e_k\) para los elementos incluidos en la submuestra dentro de cada UPM seleccionada en la primera etapa. De la misma manera, para el caso particular de la estimación de un promedio utilizando el estimador de Hájek, las anteriores expresiones pueden adaptarse convenientemente.

Si se utiliza un estimador de calibración para el total poblacional de la característica de interés \(t_y\), entonces siguiendo los lineamientos de H. A. Gutiérrez (2016, sec. 10.6), la varianza estimada del estimador utilizando la técnica de linealización de Taylor haría uso de las siguientes variables linealizadas

\[ e_k=y_k-\mathbf{x}_k'\mathbf{\hat{\theta}} \]

En donde \(\mathbf{x}_k\) son las variables relacionadas con el vector de totales auxiliares \(\mathbf{t}_{\mathbf{x}}\), medidas en la misma encuesta y \(\mathbf{\hat{\theta}}\) es el vector estimado de coeficientes de regresión entre los valores que toman la característica de interés \(y_k\) y el vector de información auxiliar \(\mathbf{x}_k\).

En la región, tanto la Pesquisa Nacional por Amostra de Domicilios Continua (PNADC), en Brasil, como la Encuesta de Caracterización Socioeconómica Nacional (CASEN), en Chile, utilizan esquemas de linealización de Taylor en conjunción con el acercamiento del último conglomerado. En resumen, la linealización de Taylor supone que es posible definir una aproximación lineal de \(\hat{\theta}\) así

\[ \hat{\theta} - \theta \approx \sum_{j=1}^p \frac{\partial f(\hat{t}_1, \ldots, \hat{t}_p) }{\partial \hat{t}_j}(\hat{t}_j - t_j) = \sum_{k\in s} w_k e_k + c \]

En donde \(e_k= \sum_{j=1}^p \frac{\partial f(\hat{t}_1, \ldots, \hat{t}_p) }{\partial \hat{t}_j} y_{jk}\) son variables linealizadas, mientras que las cantidad \(c\) representa una constante determinística que no aporta a la varianza de \(\hat{\theta}\). Nótese lo conveniente de expresar esta aproximación de esta manera puesto que al final, las cantidades que intervienen en la varianza se pueden expresar como una suma ponderada de las variables \(e_k\) y por consiguiente es posible aplicar todos los principios establecidos anteriormente. De esta forma, asumiendo el escenario de muestreo planteado en las secciones anteriores, el estimador de la varianza de la aproximación lineal de \(\hat{\theta}\) está dado por

\[ \widehat{Var}(\hat{\theta}) = \sum_h\frac{n_h}{n_h-1}\sum_{i\in s_h}\left(\hat{t}_{e_i}-\bar{\hat{t}}_{e_h}\right)^2 \]

En donde \(\hat{t}_{e_i} = \sum_{k \in s_{hi}} w_k e_k\) y \(\bar{\hat{t}}_{e_h}=(1/n_h)\sum_{i \in s_h}\hat{t}_{e_i}\). Por ejemplo, si el interés estuviera en estimar una razón, entonces las nuevas variables linealizadas son \(e_k=(1/\hat{t}_{y_2})(y_{1k}-\hat{\theta} \ y_{2k})\).

Referencias

———. 2016. Estrategias de muestreo: diseño de encuestas y estimación de parámetros. Segunda edición. Ediciones de la U.
Valliant, Richard, Jill A. Dever, y Frauke Kreuter. 2013. Practical Tools for Designing and Weighting Survey Samples. Springer New York. https://doi.org/10.1007/978-1-4614-6449-5.