Predictive Model of Student Dropout Based on Logistic Regression

Abstract

Student desertion is a phenomenon that has spread significantly in many higher education institutions in Ecuador. The objective of the research was to develop a predictive model of student dropout based on multiple binary logistic regression, with the purpose of detecting possible dropouts. The methodology used consists of three phases: Phase 1: Analysis of variables; Phase 2: Formulation of the mathematical model; and Phase 3: Evaluation. For the estimation of the coefficients of the model, the SPSS tool was obtained. After the creation of the predictive model, it was concluded that the most significant variables that contribute to the diagnosis of dropout are marital status, age, gender, Note2s, and Note1s. It is also evident that students have a higher risk of dropping out if they are married and lower risk if they are single or divorced. Finally it was concluded that gender is a factor that directly influences dropout; male students are more likely to drop out than females.


Keywords: logistic regression, predictive model, desertion.


Resumen


La deserción estudiantil es un fenómeno que se ha extendido significativamente en gran cantidad de instituciones educativas de nivel superior en el Ecuador. El objetivo de la investigación fue desarrollar un modelo predictivo de deserción estudiantil basado en la regresión logística binaria múltiple, con el propósito de detectar a posibles desertores. La metodología utilizada consta de tres fases: Fase1: Análisis de variables. Fase2: Formulación del modelo matemático. Fase3: Evaluación. Para la estimación de los coeficientes del modelo se utilizó la herramienta SPSS. Posterior a la creación del modelo predictivo se llegó a concluir que las variables más significativas que aportan al diagnóstico de la deserción son estado civil, edad, género Nota2s y Nota1s, además se evidencia que los estudiantes tienen mayor riesgo de deserción si están casados y menor riesgo si están solteros o divorciados, finalmente se concluye, que el género es un factor que influye directamente en la deserción, los estudiantes masculinos son más propensos a desertar que los femeninos.


Palabras Clave: regresión logística, modelo predictivo, deserción.

References
[1] Durán J, Díaz G. Análisis de la deserción estudiantil en la universidad autónoma metropolitana. Revista iberoamericana de educación superior. 1990;19(2):95–128.

[2] Ovares R. Análisis de las estrategias para la prevención de la deserción y retención de la población estudiantil que lleva a cabo el personal docente y administrativo del Liceo de Miramar. Gestión Education. 2012;2:1–27.

[3] Argote I, Jimenez R, Gómez J. Cuarta Conferencia Latinoamericana sobre el abandono en la Educación Superior. In: Detección de patrones de deserción en los programas de pregrado de la Universidad Mariana de San Juan de Pasto, aplicando el proceso de descubrimiento de conomimientosobre base de datos (KDD) y su implementación en modelos matemáticos de predicción. Colombia; 2014; 1–7.

[4] Girón Cruz LE, González Gómez DE. Determinantes del rendimiento académico y la deserción estudiantil, en el programa de Economía de la Pontificia Universidad Javeriana de Cali. EcoGestDesarro. 2005;3:173–201.

[5] Azoumana K. Análisis de la deserción estudiantil en la Universidad Simón Bolívar, Facultad Ingeniería de Sistemas, con Técnicas de minería de datos. Pensam Am. 2013;6(10):41–51.

[6] Más-Estellés. Alcover-Arándiga, Dapena-Janeiro, Valderruten-Vidal, Satorre-Cuerda, Llopis-Pascual, et al. Rendimiento académico de los estudios de Informática en algunos centros españoles. XV Jenui; 2009: 8.

[7] Páramo GJ, Maya CA. Deserción estudiantil universitaria. Conceptualización. Volume 35. Revista Universidad EAFIT; 2012; 65–78.

[8] Bernardo Gutiérrez AB, Cerezo Menéndez R, Rodríguez-Muñiz LJ, Núñez Pérez JC, Tuero Herrero E, Esteban García M. Predicción del abandono universitario: variables explicativas y medidas de prevención. Rev. Rafael Rodriguez-Fuentes [Internet]. 2015;(16):63–84. Available from: https://revistascientificas.us.es/index.php/fuentes/article/view/2363

[9] González MT. Absentismo y abandono escolar: una situación singular de la exclusión educativa. Revista Iberoamericana sobre Calidad., Eficacia y Cambio en Educación. 2006;4(1):1–15.

[10] Sifuentes Bitocchi O. Modelos predictivos de la deserción estudiantil en una universidad privada peruana. inD Dataset. 2018;21(2):47.

[11] Barrero J, Garzón G, Gómez Ó. Variables asociadas con el fenómeno de la deserción de los estudiantes en la Fundación Universitaria Konrad Lorenz. Pensando Psicología. 2013;9(16):55–68.

[12] Martínez AF, Márquez JC, Martín BC, Alonso SS, Campos JC. Predicción de lesiones deportivas mediante modelos matemáticos. Apunts. Medicina de l’Esport. 2008;43(157):41–44.

[13] Balaguer P. Una explicación del rendimiento estudiantil universitario mediante modelos de regresión logística. Visión Gerencial. 2009;0(2):415–427.

[14] Bonaldo L, Pereira LN. Dropout: Demographic Profile of Brazilian University Students [Internet]. Procedia - Social and Behavioral Sciences. 2016;228( June):138–143.

[15] García MV, Alvarado J, Jiménez A. La predicción del rendimiento académico: regresión lineal versus regresión logística. Psicothema. 2000;12:222–248.

[16] Ponsot E, Sinha S, Varela L, Varela J. Un modelo de regresión logística del rendimiento en los estudios universitarios: Caso FACES-ULA. 2009.

[17] Reyes Rocabado J, Escobar Flores C, Duarte Vargas J, Ramírez Peradotto P. Una aplicacion del modelo de regression logistica en la prediccion del rendimiento estudiantil. Estud Pedagóg (Valdivia). 2007;33(2):101–120.

[18] Santosa RG, Chrismanto AR. Logistic Regression model for predicting first semester GPA category based on high school academic achievement. Researchers World : Journal of Arts Science & Commerce. 2017;VIII(2): Researchers World : Journal of Arts Science & Commerce 1–12.

[19] Lichtenberger E, George-Jackson C. Predicting high school students’ interest in majoring in a STEM field: Insight into high school students’ postsecondary plans. Journal of Career and Technical Education. 2012;28(1). https://doi.org/10.21061/jcte.v28i1.571.

[20] Constitución de la Republica del Ecuador. Publicada en el Registro Oficial 449 de 20 de octubre de 2008 [Internet]. Registro Oficial 449 20 October 2008. Quito Ecuador; 2008. Available from: https://www.oas.org/juridico/pdfs/mesicic4_ecu_const.pdf

[21] Calderón MG, Espinel EE, Garzón PV, Pástor CR. Impacto social de la deserción estudiantil en la Facultad de Ciencias Químicas en primer semestre de la Universidad Central del Ecuador. Polo del Conocimiento. 2017;2(8):65.

[22] Castro B, Rivas G. Estudio sobre el fenómeno de la deserción y retención escolar en localidades de alto riesgo. Soc Hoy. 2006;(11):35–72.

[23] Silvente VB, Baños RV. Cómo obtener un Modelo de Regresión Logística Binaria con SPSSRevista Innova Educación. 2014;8(2):105–118.

[24] López-Roldán P, Fachelli S. Metodología de la investigación social cuatitativa [Internet]. Primera Ed. Universidad Autónoma de Barcelona, editor. Universidad Autónoma de Barcelona. Barcelona; 2016:55. Available from: https://ddd.uab.cat/pub/caplli/2016/163570/metinvsoccua_a2016_cap3-10.pdf

[25] Hosmer D, Stanley L. Regresión Logístic Aplicada. Segunda Ed. Vol. 70, Journal of Environmental Health. Ohio: Wiley series de probabilidad y estadística; 2007.

[26] Clifford B, Taylor R. Bioestadística. Primera Ed. PEARSON, editor. Bioestadística. México; 2014:531.

[27] Llaugel FA, Fernández AI. Evaluación del uso de modelos de regresión logística para el diagnóstico de Instituciones Financieras. Revista Internacional de Investigación en Ciencias Sociales. 2011;36(4):XXXVI.

[28] Field A, Miles J. Discovering Statistics using R [Internet]. Primera Ed. Vol. 1. Londres: SAGA Publications; 2012:957. Available from: https://nyucdsc. github.io/learningr/assets/discoveringstatistics.pdf