20.3 Empalme de series de tiempo

A continuación se realiza un recuento de algunas técnicas que permiten empalmar dos series. Cada uno de los escenarios que se enlistan a continuación deberá ser adoptado a las necesidades de cada ONE y de cada encuesta. En términos de notación, \(\hat \theta^{R}_t\) representa la estimación regular en el tiempo \(t\), \(\hat \theta^{N}_t\) denota la nueva estimación en el tiempo \(t\) y \(\hat \theta^{E}_t\) corresponde a la estimación empalmada en el tiempo \(t\).

20.3.1 Factor suavizado

DiNatale (2003) presenta el siguiente ajuste que suaviza sistemáticamente el cambio entre la nueva serie en tiempo del rediseño (\(t_b\)) y la serie regular en el punto inmediatamente anterior \(t_b-1\). Es necesario identificar el punto donde ocurrió el cambio \(t_b\), así como el punto que indicará el comienzo del empalme \(t_1\). Luego, se debe calcular el factor de ajuste que representa el cambio (porcentual). \[ \gamma_t=\left(\frac{\hat \theta^{N}_{t_b}}{\hat \theta^{R}_{t_b-1}} -1\right) \times \psi_t \] Así, suponiendo que \(\psi_t = \frac{t}{t_b-1} \in (0,1)\) es un factor que aumenta a medida que el tiempo se acerca al punto de quiebre \(t_b\), entonces la serie empalmada queda definida como \[ \hat \theta^{E}_t=\hat \theta^{R}_t* (1+\gamma_t), \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{con } t=1,2,\cdots,t_b-1. \]

En la Figura 20.2 es posible observar cómo se empalman las series regular y nueva a partir del ajuste proporcional. Nótese que la estructura de la serie se mantiene integralmente.

Empalme de series de tiempo con el método del factor suavizado. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

Figura 20.2: Empalme de series de tiempo con el método del factor suavizado. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

20.3.2 Ajuste sintético aditivo y multiplicativo

En este caso se supone que la serie regular y la serie nueva se observan desde \(t_b\) y que la serie empalmada sigue un ajuste aditivo dado por la siguiente expresión:

\[ \hat \theta^{E}_t=\hat \theta^{R}_t + \left(\hat \theta^{N}_{t_b} - \hat \theta^{R}_{t_b}\right) \times \psi_t , \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{con } t=1,2,\cdots,t_b-1. \]

Este método tiene la desventaja de que la serie empalmada podría producir valores por fuera del rango del indicador de interés; por ejemplo, podria producir valores negativos. Por tanto, para evitar estos inconvenientes, es posible acudir a un empalme sintético multiplicativo, dado a continuación:

\[ \hat \theta^{E}_t=\hat \theta^{R}_t \left(\dfrac{\hat \theta^{N}_{t_b}}{\hat \theta^{R}_{t_b}}\right) \times \psi_t , \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{con } t=1,2,\cdots,t_b-1. \]

Brakel, Smith, y Compton (2008) afirma que con los anteriores métodos la serie empalmada puede ser mayor que uno o menor que cero, lo cual es especialmente contraproducente en el caso de las proporciones y tasas. La Figura 20.3 muestra el empalme de las series usando el ajuste sintético multiplicativo.

\[ \hat \theta^{E}_t=\hat \theta^{R}_t + \left(\hat \theta^{N}_{t_b} - \hat \theta^{R}_{t_b}\right) \times \left( \dfrac{\hat \theta^{R}_t(1-\hat \theta^{R}_t)}{\hat \theta^{R}_{t_b}(1-\hat \theta^{R}_{t_b})}\right) , \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \text{con } t=1,2,\cdots,t_b-1. \]

Empalme de series de tiempo con el ajuste sintético multiplicativo. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

Figura 20.3: Empalme de series de tiempo con el ajuste sintético multiplicativo. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

20.3.3 Modelos estructurales

En el caso en el que no se tenga la oportunidad de tener un experimento paralelo y, por lo tanto, se carezca de dos series paralelas, es posible ajustar un modelo estructural de series de tiempo con una intervención justo en el momento del rediseño. Para simplificar la notación, en esta sección se supone que la serie no tiene estacionalidad, ni ciclos; aunque si los tuviera el espíritu del ajuste se mantiene. Por ende, siguiendo a Brakel, Smith, y Compton (2008), el modelo estructural para la serie está dado por el nivel \(L_t\) más el impacto \(\beta\) en el momento del rediseño \(t_b\) y se escribe de la siguiente manera:

\[ \hat \theta_{t}=L_t+\beta\delta_t+e_t \] En donde \(\delta_t\) es una variable indicadora del tiempo en el que se implementó el rediseño en la encuesta

\[ \delta_t = \begin{cases} 1 & \text{si $t\geq t_b$}\\ 0 & \text{si $t< t_b$} \end{cases} \]

Además, \(L_t\) es una tendencia estocástica autorregresiva que depende de una pendiente: \[ \begin{aligned} L_t & = L_{t-1}+R_{t-1}+w_t \\ R_t & = R_{t-1}+\eta_t \end{aligned} \] Note que \(R_t\) es la pendiente, y \(e_t\), \(w_t\) y \(\eta_t\) son ruidos de las diferentes ecuaciones. Este modelo debe ser escrito en la forma de estado-espacio, para que por medio de la apliccación del filtro de Kalman, se logre la estimación de los parámetros y la extracción de los diferentes componentes de la serie (nivel, pendiente y efecto). El modelo de estado espacio está conformado por las ecuaciones de observación (medición) y estado (transición) que, respectivamente, están dadas por las siguientes expresiones:

\[ \begin{aligned} \hat \theta_{t}&=Z_t\alpha_t+\epsilon_t\\ \alpha_t&=T\alpha_{t-1}+\omega_t \end{aligned} \] En donde \(\alpha_t\) se conoce como el vector de estado. Para nuestro modelo estructural, \(\alpha_t\) está dado por \(\alpha_t=(L_t, R_t,\beta)'\). De esta forma, la ecuación de transición está definida por:

\[ \alpha_t=\begin{bmatrix} L_t\\ R_t\\ \beta \end{bmatrix}=\begin{bmatrix} 1&1&0\\ 0&1&0\\ 0&0&1 \end{bmatrix} \begin{bmatrix} L_{t-1}\\ R_{t-1}\\ \beta \end{bmatrix}+ \begin{bmatrix} w_t\\ \eta_t\\ 0 \end{bmatrix} \]

Mientras que la ecuación de medición queda como sigue:

\[ \hat \theta_{t}=\begin{bmatrix} 1&0&\delta_t \end{bmatrix}\begin{bmatrix} L_t\\ R_t\\ \beta \end{bmatrix}+e_t \]

Para emplamar la serie antes del punto \(t_b\), se toma la serie regular y añadiendo gradualmente el efecto \(\hat{\beta}\). Por ende, la serie empalmada será:

\[ x^{adj,2}_t= \begin{cases} x_t+\hat{\beta}*\psi_t&\text{si $t<t_0$}\\ x_t&\text{si no} \end{cases} \]

Los resultados de la aplicación del modelo son bastante satisfactorios, puesto que además de extraer la estructura de la serie, el modelo estructural es capaz de estimar correctamente el impacto de la intervención, sin necesidad de tener las dos series en paralelo. La Figura 20.4 muestra el empalme de las series usando este acercamiento. Este tipo de modelos tienen bastantes ventajas metodológicas; por ejemplo, es posible ajustar más de un punto de intervención e incluso es posible incluir intervenciones de todo tipo (efecto en un solo tiempo, el mismo efecto o efecto creciente a partir de un tiempo). También es posible extraer la tendencia para suavizar la serie, la cual puede incluir componentes de estacionalidad o ciclos; además, es posible incluir otras series como covariables (con relaciones cambiantes en el tiempo).

Empalme de series de tiempo usando un modelo estructural. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

Figura 20.4: Empalme de series de tiempo usando un modelo estructural. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

Por último, en el caso en el que se disponga de ambas series en paralelo, también es posible proponer un modelo estructural bivariado. Asumiendo que las dos series no tienen componente estacional, podemos formular el modelo estructural bivariado para el vector \((\hat \theta^{R}_t,\hat \theta^{N}_t)'\) está dado por:

\[ \begin{aligned} \hat \theta^{R}_t &= L_t+e_{1,t} \\ \hat \theta^{N}_t &= L_t+\beta\delta_t+e_{2,t} \end{aligned} \]

Para este modelo estructural, la ecuación de transición toma la misma forma que en el modelo univariado, mientras que la ecuación de medición queda como:

\[ \begin{bmatrix}\hat \theta^{R}_t\\\hat \theta^{N}_t\end{bmatrix}=\begin{bmatrix} 1&0&0\\ 1&0&\delta_t \end{bmatrix}\begin{bmatrix} L_t\\ R_t\\ \beta \end{bmatrix}+e_t \]

Al igual que en el modelo estructural univariado, los resultados de la aplicación logran extraer la estructura de la serie y estimar correctamente el impacto de la intervención. La Figura 20.5 muestra el empalme de las series usando este acercamiento.

Empalme de series de tiempo usando un modelo estructural. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

Figura 20.5: Empalme de series de tiempo usando un modelo estructural. La línea negra corresponde a la serie regular; la línea azul representa la serie nueva; la línea roja denota la serie empalmada. Fuente: elaboración propia.

Referencias

Brakel, Jan van den, Paul Smith, y Simon Compton. 2008. «Quality procedures for survey transitions - experiments, time series and discontinuities». Survey Research Methods 2 (3): 123-41.
DiNatale, M. L. 2003. «Creating Comparability in CPS Employment Series», 3.