4.5 Estimador de Webster-Kemp
Webster and Kemp (2013) usan una perspectiva bayesiana no informativa para estimar el tamaño total de la población bajo un modelo de captura y recaptura con dos fuentes. El modelo se basa en que la probabilidad de encontrar un número específico de coincidencias depende de \(N\) y usan el teorema de Bayes. Lo que permite escribir:
\[P(N|N_{+1}, N_{1+}, N_{11}) = \frac{P(N_{1+}, N_{+1}, N_{11}|N)P(N)}{P(N_{1+}, N_{+1}, N_{11})}\]
Bajo el enfoque bayesiano propuesto, el estimador del número de elementos no observados es:
\[\hat{N}_{22} = \frac{(\hat{N}_{12}+1)(\hat{N}_{21}+1)}{\hat{N}_{11} + 2}, \text{ si } \hat{N}_{11} > 2\]
Dado que \(\hat{N}_{11} > 2\), el estimador bayesiano del total poblacional es:
\[ \hat{N}_{\text{WK}} = \hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \frac{(\hat{N}_{12} + 1)(\hat{N}_{21} + 1)}{\hat{N}_{11} - 2}\]
y si \(\hat{N}_{11} > 3\), el estimador de la varianza para \(\hat{N}_{\text{22}}\) es:
\[\hat{V}(\hat{N}_{\text{22}}) = \frac{(\hat{N}_{12} + 1)(\hat{N}_{21} + 1)(\hat{N}_{+1} - 1)(\hat{N}_{1+} - 1)}{(\hat{N}_{11} - 2)^2(\hat{N}_{11} - 3)}\] Por lo tanto
\[\hat{V}(\hat{N}_{\text{NW}}) = \hat{V}(\hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \hat{N}_{22})\]
En algunos casos se asume que los valores de \(N_{11}, N_{12}\) y \(N_{21}\) son observados de manera exacta, por lo que \(\hat{V}(\hat{N}_{\text{NW}}) = \hat{V}(\hat{N}_{22})\). Sin embargo, en un muestreo complejo como el de las encuestas de cobertura, los \(\hat{N}_{ij}\) son estimaciones obtenidas con el estimador Horvitz-Thompson o estimadores de calibración, y por tanto se debe incorporar la incertidumbre proveniente del diseño, así que sugerimos usar un método basado en réplicas para estimar la varianza.