Tras 2 años de cooperación internacional: investigadores UdeC crean nuevo método estadístico
Crédito: Departamento de Estadística.
El estudio es un aporte a la disciplina y se centra en uno de los supuestos fundamentales en el modelamiento de datos.
Los académicos del Departamento de Estadística de la Universidad de Concepción, doctores Guillermo Ferreira (foto principal) y Joel Muñoz, junto a Jorge Mateu de la Universidad Jaime I y José Vilar de la Universidad de La Coruña, ambas de España, desarrollaron una nueva metodología estadística para enfrentar la ausencia de uno de los supuestos fundamentales en el modelamiento de datos que son registrados secuencialmente en el tiempo.
Este supuesto es el de estacionariedad y según explica el Dr. Guillermo Ferreira “se refiere a mantener constantes las propiedades de estadísticas del modelo, mantenerlas estables a lo largo del tiempo”.
Sin este supuesto, agrega, no se pueden utilizar las metodologías tradicionales para enfrentar datos con dependencia temporal y realizar predicciones confiables.
La mayoría de las bases de datos con registros en el tiempo no cumplen con este supuesto, es decir son datos no-estacionarios; por lo tanto, muchos investigadores realizan transformaciones a los datos para conseguir la estacionariedad.
Por ejemplo, en econometría puede suceder que bajo no-estacionariedad, los estimadores de mínimos cuadrados sean significativos cuando no lo son (falso positivo) y, por lo tanto, los analistas pueden emitir conclusiones erróneas de cierto fenómeno.
“En este contexto, nuestro trabajo proporciona una metodología para determinar con mayor exactitud el grado de dependencia de ciertas variables bajo el supuesto de no-estacionariedad”, comenta el Dr. Ferreira.
Con este estudio los científicos entregan una herramienta estadística para los modelos de regresión; estos son modelos matemáticos que permiten relacionar de manera lineal variables observacionales.
Las variables registradas secuencialmente en el tiempo son un conjunto de datos que se registran en un periodo de tiempo fijo, es decir, todas las observaciones deben tener la misma unidad de medida temporal, por ejemplo, diaria, mensual o anual. Ejemplos de estos registros son el IPC, el precio del cobre, los precios de las acciones, la temperatura, etc.
Proceso de trabajo
Para el estudio se utilizaron tres herramientas: la primera fue la construcción de los procesos localmente estacionarios mediante el procedimiento de simulación de la matriz de varianza-covarianza; es decir, se trabajó directamente con los datos no-estacionarios mediante la utilización de bloques móviles de datos, de los cuales se asume estacionariedad en cada uno de ellos. Esta técnica es conocida como “estacionariedad local”.
La segunda fue la metodología de estimación de estos procesos, para ello se utilizaron técnicas de optimización de “Whittle Local”. Finalmente, se hizo uso de técnicas de remuestreo para conseguir la distribución muestral de los estimadores.
“La propuesta de este paper es conseguir las estimaciones de los parámetros del modelo de regresión mediante la técnica de ‘mínimos cuadrados ordinarios’. Esta técnica es muy usada por los econometristas para estimar los efectos ‘ceteris paribus’ de una variable. Sin embargo, uno de los supuestos en el modelo de regresión es la estacionaridad la cual no se cumple en muchos casos. La violación de este supuesto conduce a conclusiones erróneas de cierto fenómeno. En este contexto, nuestro trabajo proporciona una metodología para determinar los estimadores de Mínimos Cuadrados Ordinarios bajo el supuesto de no-estacionariedad”, finaliza el Dr. Ferreira, también director del Departamento de Estadística UdeC.
Este trabajo cohesiona diferentes metodologías que en su momento requerían una carga computacional enorme, por ejemplo, las técnicas bootstrap (técnica de remuestreo que permite obtener las distribuciones empíricas o muestrales de las principales características estadísticas de los datos) propuestas en el siglo XX requerían de un costo computacional enorme, lo mismo para la simulación y el modelamiento de procesos localmente estacionarios.
Para solucionar este tipo de dificultad, en este artículo los autores usaron técnicas de paralelización computacional; es decir, la utilización de múltiples núcleos (cores de computador) para trabajar simultáneamente en diferentes partes de un problema, el cual reduce los tiempos de cómputo logrando ser más eficiente, lo que se conoce como computación de alto rendimiento.
- Compartir
- Compartir
Noticias relacionadas
Reportajes