Abstract:
El trabajo de investigación es una propuesta de un Software para la verificación y detección de manera automática de la similitud en los trabajos de investigación en la Universidad Nacional del Altiplano de Puno. Los procesos para la detección de la similitud se divide en tres partes, en primer lugar se realiza las tareas de pre-análisis, que consiste en la conversión de los documentos en los formatos PDF, DOC a un archivo de texto plano, una vez echo eso inmediatamente se realiza la eliminación de los espacios mayores a uno, la conversión a minúsculas y la eliminación de caracteres especiales. La segunda parte consiste en un análisis a priori, en la que utilizamos algoritmos no tan costosos para determinar si el documento en cuestión es posiblemente plagiado. Finalmente se tiene el análisis riguroso que tienen como entrada todos los documentos que pasaron la primera fase y a través de estos procesos se va a determinar cuál es el nivel de similitud del documento solicitado para el análisis, esto se hará expresándolo en porcentaje, así mismo se muestra cuáles son los archivos fuentes de esas coincidencias. Para realizar las pruebas iniciales y posteriormente la puesta en marcha del Software, se tomó los proyectos de tesis de pregrado que actualmente se tienen presentados a partir del semestre 2016-I en la UNAP, el Software, para detectar la similitud.