Árbol De Decisión, Aplicación Con Datos Meteorológicos/Decision Tree, Application With Meteorological Data

Abstract

La minería de datos es una técnica que hoy en día se aplica en muchas áreas de las ciencias, es por ello que con el objetivo de identificar variables meteorológicas predominantes a ocho intervalos de tiempo se aplicó la técnica supervisada árbol de clasificación en data mining. La información se obtuvo de la estación Alao, misma que se encuentra ubicada a 3064 m.s.m en la provincia de Chimborazo, Ecuador. El estudio se realizó mediante código desarrollado en el software estadístico R; los datos corresponden a información por hora del año 2016, las variables analizadas fueron; temperatura del aire, humedad relativa, presión barométrica, radiación solar difusa, radiación solar global, temperatura del suelo a −20cm y velocidad de viento. El árbol mostró que la principal variable en esta zona es la radiación solar global, a horas comprendidas de 06h00 a 08h00, si ésta es mayor o igual a 120w/m2, entonces se puede determinar la presión barométrica de 09h00 a 11h00 de la mañana; y si ésta es mayor o igual que 709w/m2, entonces se predice la temperatura del aire. El árbol de decisión es una técnica que permitió identificar variables meteorológicas relevantes, en determinadas horas donde se encuentra ubicada la estación Alao.


Abstract: Data mining is a technique that today is applied in many areas of science, which is why in order to identify predominant meteorological variables at eight time intervals the supervised tree classification technique was applied in data mining. The information was obtained from the Alao station, which is located at 3064 m.s.m in the province of Chimborazo, Ecuador. The study was carried out using a code developed in statistical software R, the data correspond to information by hour of the year 2016, the variables analyzes were air temperature, relative humidity, barometric pressure, diffuse solar radiation, global solar radiation, soil temperature at −20cm and wind speed. The showed that the main variable in this area is the global solar radiation, at hours between 06h00 and 08h00, if it is greater than or equal to 120w/m2, then the barometric pressure can be determined from 09h00 to 11h00 of the morning, if, and it is great than or equal to 709w/m2, then the air temperature is predicted. The decision tree is a technique that allowed us to identify relevant meteorological variables in certain hours where the Alao station is located.


Palabras clave: árboles de decisión, datos meteorológicos.


Keywords: decision tree, meteorological data.

References
[1] Riqueime J, Ruiz R, Gilbert K. Minería de Datos: Conceptos y Tendencias. Iberoamericana de Inteligencia Artificial. 2006; p. 11–18.

[2] Eckert K, Suénaga R. Análisis de Deserción-Permanencia de Estudiantes Universitarios Utilizando Técnica de Clasificación en Minería de Datos. Formación Universitaria. 2015; p. 3–12.

[3] Bortolini J, Alonso P, Álvarez F. Árboles de clasificación de Potimirim mexicana (Decapoda: Caridea), organismo Hermafrodita protándrico secuencial. Latin American Journal of Aquatic Research. 2013; p. 739–745.

[4] Bouza C, Santiago A. La minería de datos: Árboles de decisión y su aplicación en estudios médicos. CHAP. 2012; p. 64–78.

[5] Ruiz E, Romero C. Resultados obtenidos en un proceso de minería de datos aplicado a una base de datos que contiene información bibliográfica referida a cuatro segmentos de la ciencia. Journal of Information Systems and Technology Management. 2018; p. 1–11.

[6] Uvidia M, Cisneros A, Viñán J. Minería de datos de la evaluación integral del desempeño académico de la unidad de nivelación. Descubre. 2017; p. 44–54.

[7] Coronado M, Bianchi V, Vivas J, Perera M. Estudio comparativo de técnicas de minería de datos para la predicción de rutas de huracanes. CONAIC. 2017; p. 43–52.

[8] Haro S, Pazmiño R, Conde M, Peñalvo F. Data mining to discover the classification trend in titling works. En: XIII Congreso de Ciencia & Tecnología, ESPEQuito: Universidad de las Fuerzas Armadas, ESPE; 2018; p. 125–128.

[9] Witten I, Frank E, Hall M, Pal C. Data mining: Practical Machine Learning Tools and Techniques: Elsevier Inc.; 2016.

[10] Robles Y, Sotolongo A. Integración de los algoritmos de minería de datos 1R, PRISM E ID3 A POSTGRESQL. Gestión de Tecnología y Sistemas de Información. 2013; p. 389–406.

[11] Valero S, Vargas A, García M. Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el algoritmo de los k vecinos más cercanos. Recursos Digitales para la Educación y la Cultura. 2010; p. 30–33.

[12] Graham W. Data Mining with Rattle and D New York: Springer; 2011.

[13] Haro S, Zúñiga L, Meneses A, Vera L, Escudero A. Métodos de clasificación en minería de datos meteorológicos. Perfiles. 2018; p. 107–113.

[14] Raileanu L, Stoffel K. Theoretical Comparison between the Gini Index and Information Gain Crieteria. The Swiss National Science Foundation.

[15] Gámez M, Cortés E, Alfaro JL, García N. Árboles de clasificación para el análisis de gráficos de control multivariante. Matemática: Teoría y aplicaciones. 2008; p. 30–42.