dc.contributor.advisor | Apaza Cruz, Jorge Luis | |
dc.contributor.author | Fernandez Chambi, Mayenka | |
dc.date.accessioned | 2020-02-20T18:16:53Z | |
dc.date.available | 2020-02-20T18:16:53Z | |
dc.date.issued | 2019-12-06 | |
dc.identifier.uri | http://repositorio.unap.edu.pe/handle/20.500.14082/13506 | |
dc.description.abstract | La presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre del 2017 según calendario clasificatorio Rusia 2018 de la FIFA. El modelo del análisis de opinión o sentimiento ha sido desarrollado en la plataforma de computación distribuida Spark; demostrándose que las tareas de preparación de datos, modelado y evaluación de algoritmos de aprendizaje de máquina para clasificación de texto se han desarrollado con eficiencia dentro del pipeline de Spark entre tareas transformadoras y estimadoras sobre la estructura de datos DataFrame y la librería MLlib, así los modelos estándar de aprendizaje de máquina para Big Data pueden ser realizadas en forma escalable y distribuida con facilidad de uso por los científicos de datos. Finalmente el modelo de clasificación binario de texto de tuits ha alcanzado una precisión de 83.51% para un modelo de regresión logística y está sobre las métricas estándar de aceptación de clasificadores de su mismo tipo; adicionalmente, esta investigación deja construido y disponible el dataset “PeruARusia2018.csv” con 3000 ítems de tuits etiquetados siguiendo los estándares adecuados que la hacen propicia para que la comunidad investigadora pueda seguir experimentando sobre ella y halle mejores resultados; así como 376,250 tuits como raw data. | es_PE |
dc.description.uri | Tesis | es_PE |
dc.format | application/pdf | es_PE |
dc.language.iso | spa | es_PE |
dc.publisher | Universidad Nacional del Altiplano | es_PE |
dc.rights | info:eu-repo/semantics/openAccess | es_PE |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/deed.es | es_PE |
dc.source | Universidad Nacional del Altiplano | es_PE |
dc.source | Repositorio Institucional - UNAP | es_PE |
dc.subject | Ingeniería de Software | es_PE |
dc.subject | Minería de textos | es_PE |
dc.title | Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark | es_PE |
dc.type | info:eu-repo/semantics/masterThesis | es_PE |
thesis.degree.name | Magister Scientiae en Informática con mención en Ingeniería de Software | es_PE |
thesis.degree.discipline | Informática | es_PE |
thesis.degree.grantor | Universidad Nacional del Altiplano. Escuela de Posgrado | es_PE |
thesis.degree.level | Maestría | es_PE |