NoSQL vs. SQL in Big Data Management: An Empirical Study

Abstract

When developing a software project, it is important to choose the database that best suits the needs of the project, whether it is relational or non-relational. This article compares the efficiency of two types of database in handling input and reading large amounts of data, using the SGDB MongoDB 3.2 and Microsoft SQL Server 2016. The study concludes that, in projects where the handling of a large amount of data and a rapid response are primary requirements, it is better to use a non-relational database. In contrast, if the project requires the use of relationships between entities, without giving greater importance to the response time, it is better to opt for a related database.


Resumen: Al momento de desarrollar un proyecto software es importante escoger la base de datos que mejor se ajuste a las necesidades del proyecto. Las opciones de un técnico pueden estar entre una base de datos relacional o no relacional. El presente artículo compara la eficiencia de estos dos tipos de base de datos desde el punto de vista de la entrada y lectura de grandes cantidades de datos. Utilizamos a SGDB MongoDB 3.2 y Microsoft SQL Server 2016 para este estudio empírico. Concluimos que, en proyectos donde el manejo de una gran cantidad de datos y una respuesta rápida son requerimientos primordiales, y considerando estas variables, consideramos que podría ser idóneo el uso de una base de datos no relacional. En contraste, si el proyecto requiere el uso de relaciones entre entidades, sin dar mayor importancia al tiempo de respuesta, podría ser mejor optar por una base de datos relacional.

References
[1] S. Tiwari, Professional NoSQL. John Wiley & Sons, 2011.

[2] A. B. M. Moniruzzaman y S. A. Hossain, «Nosql database: New era of databases for big data analytics-classification, characteristics and comparison», ArXiv Prepr. ArXiv13070191, 2013.

[3] A. Boicea, F. Radulescu, y L. I. Agapin, «MongoDB vs Oracle--database comparison», en Emerging Intelligent Data and Web Technologies (EIDWT), 2012 Third International Conference on, 2012, pp. 330–335.

[4] R. Hecht y S. Jablonski, «NoSQL evaluation: A use case oriented survey», en Cloud and Service Computing (CSC), 2011 International Conference on, 2011, pp. 336–341.

[5] C. Strauch, U.-L. S. Sites, y W. Kriha, «NoSQL databases», Lect. Notes Stuttg. Media Univ., vol. 20, 2011.

[6] A. Beaulieu, Learning SQL: Master SQL Fundamentals. O'Reilly Media, Inc., 2009.

[7] V. Sharma y M. Dave, «Sql and nosql databases», Int. J. Adv. Res. Comput. Sci. Softw. Eng., vol. 2, no. 8, 2012.

[8] F. Chang et al., «Bigtable: A distributed storage system for structured data», ACM Trans. Comput. Syst. TOCS, vol. 26, no. 2, p. 4, 2008.

[9] G. DeCandia et al., «Dynamo: amazon's highly available key-value store», en ACM SIGOPS operating systems review, 2007, vol. 41, pp. 205–220.

[10] Y. Li y S. Manoharan, «A performance comparison of SQL and NoSQL databases», en Communications, computers and signal processing (PACRIM), 2013 IEEE pacific rim conference on, 2013, pp. 15–19.

[11] B. Dayley, NoSQL with MongoDB in 24 Hours, Sams Teach Yourself. Sams Publishing, 2014.