Técnicas de machine learning para predecir el rendimiento académico en los estudiantes de la Universidad Nacional Agraria de la Selva

Abstract

El objetivo de esta investigación es determinar en qué porcentaje las técnicas de machine learning permiten predecir el rendimiento académico de los estudiantes de la UNAS, mediante las métricas de evaluación: exactitud, precisión, sensibilidad, especificidad, puntuación F1 y Curva ROC, con el fin de poder identificar a los alumnos con probabilidad de éxito o fracaso de acuerdo con una escala de calificación. En este estudio se hizo uso de una población de 4584 estudiantes, por lo que se usó la totalidad de la población como muestra. Asimismo, el estudio es de tipo aplicada, enfoque cuantitativo, alcance descriptivo, y diseño de investigación experimental de tipo pre-experimental de un solo grupo, esto porque luego de aplicar las técnicas de machine learning se podrá observar los resultados y realizar la medición. Para la creación de los modelos predictivos, se siguieron los pasos de la metodología KDD, utilizando Python como lenguaje de programación y Jupyter Notebook de la suite Anaconda como interfaz de desarrollo. Para visualizar los resultados, se desarrolló un prototipo en el entorno de desarrollo Spyder. Los resultados confirman la validez de las técnicas de machine learning para predecir el rendimiento académico de los estudiantes de la UNAS. Por lo que se destaca que la técnica con mejor resultado en este contexto fue Redes Neuronales con los siguientes valores: Exactitud= 96.24%, sensibilidad = 96.23%, y puntuación F1 = 96.21%. No obstante Árbol de decisión obtuvo los mejores valores de: Precisión= 95.72%, y especificidad = 95.68%, a la vez que SVM obtuvo el valor óptimo de Curva ROC=99.42%.

Description

Keywords

Machine learning, Rendimiento académico, KDD, Estudiantes, UNAS

Citation