Modelo de análisis de tópicos en ordenanzas regionales del Gobierno Regional de Puno de 2010 a 2024 utilizando técnicas de procesamiento de lenguaje natural
Abstract
Los gobiernos regionales generan una vasta cantidad de documentos oficiales que contienen decisiones, normativas y políticas públicas fundamentales para el desarrollo de sus regiones. Esta investigación tuvo como objetivo determinar un modelo de análisis que optimice la identificación de tópicos en las ordenanzas regionales emitidas por el Gobierno Regional Puno durante el periodo del mes de febrero de 2010 al mes de julio del 2024. La investigación fue de tipo no experimental con un enfoque cuantitativo, por lo cual se utilizó técnicas de extracción de información, técnicas de procesamiento de lenguaje natural (NLP) y los modelos LDA y BERTopic. Como resultado se obtuvo un corpus de 249 ordenanzas regionales pre procesadas y un modelo de identificación de tópicos BERTopic con una precisión de 0,67 en la métrica de coherencia, lo que indica una buena capacidad para capturar tópicos coherentes y significativos en el corpus de ordenanzas, por otro lado, el modelo LDA ofrece una métrica de coherencia de 0,57 lo que evidencia una capacidad menor para identificar tópicos coherentes en el contexto específico de los documentos analizados. Se concluye que el modelo propuesto permitió identificar temas como transporte, cultura, salud, medio ambiente y presupuesto; que proporcionan una comprensión más profunda de los temas priorizados en las ordenanzas regionales de Puno.