4.3 Estimador de Nour
En muchas situaciones, el fracaso de capturar a un individuo en ambas listas puede deberse a causas comunes, lo que conduce a una asociación positiva entre las dos fuentes. En otros casos, los individuos pueden estar menos dispuestos a ser registrados en la segunda lista (tasas de rechazo), lo que resulta en una asociación negativa entre las listas. Estos fenómenos se conocen como variación de respuesta conductual (Wolter 1986) .
El estimador de la cota inferior del tamaño poblacional propuesto por Nour (1982), se basa en una estimación para la cantidad no observada \(N_{12}\) (correspondiente a individuos no capturados por ninguna de las dos listas), bajo los siguientes supuestos:
Supuesto 1 (S1): Existe correlación positiva entre las listas, es decir que \[N_{11} \cdot N_{22} > N_{12} \cdot N_{21},\]
y el sistema de registro dual no es degenerado, \(\forall i, j \in \{1, 2\}, \; N_{ij} > 0\)
Supuesto 2 (S2): La probabilidad de que una unidad sea registrada en alguna de las dos fuentes es mayor que 0.5, es decir:
\[\frac{N_{1+}}{N}, \frac{N_{+1}}{N} > \frac{1}{2}.\]
Este supuesto asegura que:
\[N_{11} > N_{22}\]
Conjuntamente, los supuestos S1 y S2 garantizan que:
\[N_{11}^2 > N_{11} \cdot N_{22} > N_{12} \cdot N_{21}\]
Supuesto 3 (S3): Se cumple que:
\[N_{12} \cdot N_{21} - N_{22}^2 > 0\]
y por tanto:
\[N_{12} \cdot N_{21} < \left( \frac{N_{12} \cdot N_{21}}{N_{22}} \right)^2\]
Bajo los supuestos S1, S2 y S3, Nour (1982) mostró que la parte no observada de la población \(N_{22}\) se encuentra en el intervalo:
\[\left[ \frac{2 N_{12} N_{21} N_{11}}{N_{12} N_{21} + N_{11}^2}, \; \sqrt{N_{12} N_{21}} \right]\]
y propuso el siguiente estimador puntual:
\[\hat{N}_{22} = \frac{2 \hat{N}_{12} \hat{N}_{21} \hat{N}_{11}}{\hat{N}_{12} \hat{N}_{21} + \hat{N}_{11}^2}\]
con la justificación de que es más robusto frente a la posible violación del supuesto S3 (el cual en la práctica es difícil de verificar).
En caso de que el supuesto S3 no se vea violado, también se pueden considerar otros estimadores para \(N_{22}\), tales como:
\[\hat{N}_{22} = \sqrt{\hat{N}_{12} \hat{N}_{21}}\]
o incluso cualquier punto dentro del intervalo:
\[\left[ \frac{2 \hat{N}_{12} \hat{N}_{21} \hat{N}_{11}}{\hat{N}_{12} \hat{N}_{21} + \hat{N}_{11}^2}, \; \sqrt{\hat{N}_{12} \hat{N}_{21}} \right]\]
Dependiendo de la selección del estimador para \(N_{22}\), se obtienen dos estimadores del tamaño total de la población bajo dependencia positiva, denotados como:
- Cota inferior \(\hat{N}_L\):
\[\hat{N}_L = \hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \frac{2 \hat{N}_{12} \hat{N}_{21} \hat{N}_{11}}{\hat{N}_{12} \hat{N}_{21} + \hat{N}_{11}^2}\]
- Cota superior \(\hat{N}_U\):
\[\hat{N}_U = \hat{N}_{11} + \hat{N}_{12} + \hat{N}_{21} + \sqrt{\hat{N}_{12} \hat{N}_{21}}\]
Los estimadores no no cuentan con una expresión analítica que permita estimar la varianza, por lo que es necesario usar métodos basados en réplicas.