Abstract:
Los Repositorios Institucionales permiten organizar y preservar la producción científica de una Institución, la presente investigación tiene como finalidad optimizar la extracción de metadatos y publicación de documentos de investigación procesos fundamentales para la administración de Repositorios Institucionales que requieren de tiempo, mediante la implementación del software “E-MeRI”, cuya población se compone por 1518 documentos de investigación. Para el desarrollo del sistema se utilizó la programación por capas y para el contraste de la hipótesis se utilizó prueba t para muestras relacionadas. Con respecto a la extracción automática se elaboró un algoritmo mediante técnicas de procesamiento de lenguaje natural, al cual se determinó la complejidad algorítmica lineal O(n) y demostró ser eficiente en comparación a otras herramientas extractoras. A la misma vez se determinó el nivel de precisión entre 96% y 99% de resultados correctos en base a las métricas Precisión y Recall. De la diferencia del tiempo de extracción, el sistema logra reducir en 5 minutos y 21 segundos por documento y permitió extraer en un minuto 4 documentos. Se concluye que la extracción automática de metadatos y la publicación de documentos de investigación mejoran la administración del Repositorio Institucional de la Universidad Nacional del Altiplano, reduciendo el tiempo de extracción y publicación de forma significativa con un valor p (0.000)< α=0.05, además la evaluación del software basado en la norma ISO 25000 obtuvo un valor de 8.93 de calidad total, logrando un nivel cumple con los requisitos y un grado muy satisfactorio.