Abstract:
Los modelos de aprendizaje supervisado basados en bosques aleatorios (Random Forest) tienen alto desempeño al momento de clasificar los factores determinantes que permiten el ingreso de un postulante a la universidad. Esta investigación es de tipo cuasi-experimental y utiliza el método de análisis cuantitativo, en consecuencia el objetivo es evaluar los factores determinantes asociados al ingreso de los postulantes a la universidad. Inicia con el preprocesamiento, comprensión de los datos de admisión y clasificarlos por áreas y procesos de admisión, esta etapa se completa con la limpieza de los datos para evitar lecturas erróneas, luego se construye el modelo de aprendizaje supervisado de bosques aleatorios cuya tarea es predecir con exactitud el ingreso o no de un postulante a la universidad, previo a ello, se establece ajustes utilizando la librería sickit-learn para separar los datos de entrenamiento y de prueba, así como para establecer los hiperparámetros optimizados para cada área y proceso de admisión, solo para garantizar su desempeño óptimo. La exactitud de los resultados depende de la pureza de los datos de entrada, esto confirma la importancia que tiene los factores determinantes asociados al área y proceso de admisión, durante este análisis exploratorio, el modelo propuesto clasifica y predice con una exactitud entre el 80% y el 91% que un postulante ingresa o no a la universidad. Finalmente, la investigación concluye que los factores determinantes: puntaje obtenido, las asignaturas con mayor ponderación, la edad y los años de haber egresado del colegio son los de mayor importancia.