4.4 Estimador de Chao

Chao (Chao 1987, 1989) propuso un estimador para el tamaño poblacional que relaja el supuesto de independencia entre las fuentes del censo y la encuesta de cobertura, y permite heterogeneidad no observada en las probabilidades de captura. Este estimador se enfoca en el número mínimo de individuos no observados \(N_{22}\) que puede explicarse a partir de los datos observados.

El modelo binomial mixto con parámetro 2 equivalente al número de fuentes usadas, se puede formular como:

\[E(N_j) = N \int_0^1 \binom{2}{j} p^j (1-p)^{2-j} f(p) dp, \quad j = 0, 1, 2,\]

donde \(N_j\) es el número de individuos presentes en \(j\) fuentes, de esta forma \(N_1 = N_{21} + N_{12}\) y \(N_2 = N_{11}\).

Al aplicar la desigualdad de Cauchy-Schwarz a dos variables aleatorias \(X\) e \(Y\), donde se cumple que:

\[[E(XY)]^2 \leq E(X^2)E(Y^2),\]

Si elegimos \(X = p\) y \(Y = (1-p)\), obtenemos:

\[\left(\int_0^1 p(1-p)f(p) dp\right)^2 \leq \int_0^1 (1-p)^2 f(p)dp \int_0^1 p^2 f(p)dp,\]

que puede reescribirse como:

\[\left(\frac{1}{2}E(N_1)\right)^2 \leq E(N_0)E(N_2),\]

de donde se deduce que:

\[E(N_0) \geq \frac{\left[E(N_1)\right]^2}{4E(N_2)}.\] Sustituyendo las frecuencias esperadas por las observadas, obtenemos el límite inferior de Chao para estimar \(N_0\):

\[\hat{N}_0 = \frac{N_{1}^2}{4N_{2}} = \frac{(N_{21}+N_{12})^2}{4N_{11}}.\] Así el estimador de Chao para el tamaño poblacional total se obtiene como:

\[\begin{align} \hat{N}_{CH} &= \hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \frac{\hat{N}_{1}^2}{4\hat{N}_{2}}\\ &= \hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \frac{(\hat{N}_{21}+\hat{N}_{12})^2}{4\hat{N}_{11}} \end{align}\]

La aproximación de la varianza de estimador es:

\[ \hat{V}(\hat{N}_{CH}) \approx \frac{(\hat{N}_{21}+\hat{N}_{12 })^2}{4\hat{N}_{11}^3} \left( \frac{(\hat{N}_{21}+\hat{N}_{12})^2}{4\hat{N}_{11}} + \hat{N}_{21}+\hat{N}_{12} + \hat{N}_{11} \right)\]

References

Chao, Anne. 1987. “Estimating the Population Size for Capture-Recapture Data with Unequal Catchability.” Biometrics, 783–91.
———. 1989. “Estimating Population Size for Sparse Data in Capture-Recapture Experiments.” Biometrics, 427–38.