4.5 Estimador de Webster-Kemp

Webster and Kemp (2013) usan una perspectiva bayesiana no informativa para estimar el tamaño total de la población bajo un modelo de captura y recaptura con dos fuentes. El modelo se basa en que la probabilidad de encontrar un número específico de coincidencias depende de \(N\) y usan el teorema de Bayes. Lo que permite escribir:

\[P(N|N_{+1}, N_{1+}, N_{11}) = \frac{P(N_{1+}, N_{+1}, N_{11}|N)P(N)}{P(N_{1+}, N_{+1}, N_{11})}\]

Bajo el enfoque bayesiano propuesto, el estimador del número de elementos no observados es:

\[\hat{N}_{22} = \frac{(\hat{N}_{12}+1)(\hat{N}_{21}+1)}{\hat{N}_{11} + 2}, \text{ si } \hat{N}_{11} > 2\]

Dado que \(\hat{N}_{11} > 2\), el estimador bayesiano del total poblacional es:

\[ \hat{N}_{\text{WK}} = \hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \frac{(\hat{N}_{12} + 1)(\hat{N}_{21} + 1)}{\hat{N}_{11} - 2}\]

y si \(\hat{N}_{11} > 3\), el estimador de la varianza para \(\hat{N}_{\text{22}}\) es:

\[\hat{V}(\hat{N}_{\text{22}}) = \frac{(\hat{N}_{12} + 1)(\hat{N}_{21} + 1)(\hat{N}_{+1} - 1)(\hat{N}_{1+} - 1)}{(\hat{N}_{11} - 2)^2(\hat{N}_{11} - 3)}\] Por lo tanto

\[\hat{V}(\hat{N}_{\text{NW}}) = \hat{V}(\hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \hat{N}_{22})\]

En algunos casos se asume que los valores de \(N_{11}, N_{12}\) y \(N_{21}\) son observados de manera exacta, por lo que \(\hat{V}(\hat{N}_{\text{NW}}) = \hat{V}(\hat{N}_{22})\). Sin embargo, en un muestreo complejo como el de las encuestas de cobertura, los \(\hat{N}_{ij}\) son estimaciones obtenidas con el estimador Horvitz-Thompson o estimadores de calibración, y por tanto se debe incorporar la incertidumbre proveniente del diseño, así que sugerimos usar un método basado en réplicas para estimar la varianza.

References

Webster, Anthony J, and Richard Kemp. 2013. “Estimating Omissions from Searches.” The American Statistician 67 (2): 82–89.