Análisis de Big Data para la identificación de factores de riesgo en salud mental en Puno
Abstract
El estudio identificó factores de riesgo en salud mental en Puno, Perú, una región con volúmenes significativos de datos clínicos y demográficos, caracterizados por heterogeneidad y limitaciones técnicas en su procesamiento. Los objetivos se enfocaron en desarrollar modelos predictivos y técnicas de segmentación basados en Big Data para identificar factores de riesgo, considerando variables diagnósticas, demográficas y geográficas. La metodología fue de diseño no experimental y correlacional, con el análisis de 583,391 registros provenientes de sistemas de salud; se aplicaron algoritmos como Random Forest y K-Means, optimizados mediante Grid Search; los datos fueron integrados utilizando técnicas ETL y procesados en un entorno distribuido que garantizó escalabilidad y precisión. Los resultados indicaron que el 64 % de los diagnósticos se asociaron con variables como geolocalización, historial de citas y categoría del establecimiento; el 30 % de los trastornos del ánimo se concentraron en áreas urbanas, mientras que la esquizofrenia presentó una prevalencia del 35 % en zonas rurales; durante noviembre, las consultas aumentaron un 25 % respecto al promedio anual; el modelo predictivo alcanzó una precisión del 88,81 %, un AUC de 0,91 y un coeficiente de silueta de 0,33, identificando cinco clústeres diferenciados. Las conclusiones destacaron que la implementación de Big Data incrementó la capacidad de segmentación en un 20 %, optimizó la distribución de recursos y permitió diseñar intervenciones personalizadas, priorizando clústeres de alta prevalencia según factores geográficos y socioeconómicos, mejorando la planificación sanitaria.