Modelos de series de tiempo con Machine Learning del costo de consumo de agua comercial y doméstico de la región de Puno: 2015-2020
Abstract
La comparación de modelos de series de tiempo y las técnicas de machine learning son desarrollados actualmente para realizar los pronósticos y obtener mejores resultados a través de entrenamiento y prueba con algoritmos de machine learning. El objetivo de la investigación fue determinar el modelo univariante con Machine Learning para ajustar la serie de consumo de agua doméstico y comercial de la EPS EMSA de la Región de Puno, periodo 2015 - 2020. La metodología fue no experimental de tipo analítica, retrospectiva, longitudinal y cuantitativa con enfoque de Box-Jenkins y las técnicas de Redes Neuronales, Facebook Prophet, y Random Forest con los que se buscó el modelo más adecuado para realizar pronósticos. Los resultados del modelo para el costo de consumo de agua doméstico fue ARIMA(0,1,1)(1,0,0)12, y las métricas de evaluación RMSE, MAE y MAPE para Redes Neuronales, Prophet y Random Forest fueron variables, y para el costo de consumo de agua comercial se obtuvo modelo ARIMA(0,1,2)(1,0,0)12 con métricas de evaluación RMSE, MAE y MAPE diferentes. Las conclusiones de los modelos ARIMA(0,1,1)(1,0,0)12, y ARIMA(0,1,2)(1,0,0)12, fueron evaluados con las métricas para costo de consumo de agua doméstico con RMSE, MAE y MAPE, se concluye que el modelo ARIMA(0,1,1)(1,0,0)12 resultó con el menor valor de MAPE de 1.945 frente a los demás modelos, y para el costo de consumo de agua comercial Facebook Prophet que resultó con el menor valor de MAPE de 5.313 frente a los demás modelos, por consiguiente los dos modelos son considerados como adecuados.