Evaluación de los modelos de Machine Learning para identificar emociones en texto en la región de Puno
Abstract
En la actualidad, el estudio de las emociones expresadas en las redes sociales constituye un tema de interés educativo y comunicativo, y resulta fundamental en la interacción humana. Además, ha experimentado un crecimiento exponencial gracias al uso de tecnologías digitales. El objetivo del estudio es determinar el desempeño de los modelos de Machine Learning para identificar emociones en texto en la región Puno. La metodología comprende el uso de Keyword Spotting Technique (KST) y procesamiento de lenguaje natural, y aplica a un total de 2160 emociones publicadas en perfiles personales de Facebook, relacionadas con actividades educativas cotidianas entre amigos y compañeros. Los datos fueron preprocesados, entrenados, evaluados e implementados en Google Colab, utilizando bibliotecas como Pandas, Scikit-learn, NumPy, TensorFlow/Keras, Matplotlib y Seaborn. Utiliza los algoritmos SVM, XGBoost, Random Forest y LightGBM, evaluados con las métricas Accuracy, Precision, Recall, F1-Score; y AUC. El modelo SVM (Máquinas de Vectores de Soporte) alcanzó un rendimiento destacable en la tarea de clasificación emocional. Obtuvo una accuracy del 78.94 %, una precisión del 79.99 % y un recall del 78.94 %. El valor de F1-Score fue de 78.29 %, lo cual representa un equilibrio adecuado entre precisión y recall. Finalmente, el modelo logró un AUC (Área Bajo la Curva ROC) de 95.4 %, lo que indica una excelente capacidad de discriminación entre las clases emocionales. En conclusión, el estudio muestra que los modelos de aprendizaje automático ayudan a entender las emociones de los estudiantes y a crear entornos educativos más inclusivos, empáticos y culturalmente adecuados.