top of page

Big Data, el futuro de los datos

  • 7 nov 2016
  • 3 Min. de lectura

El procesamiento de datos a gran escala ya es una realidad, y está cambiando la manera en que las empresas hacen los negocios. El aumento de grandes volúmenes de información en los últimos años ha sido influenciado en mayor escala a las redes sociales.

Pero Big Data, no es un motor de base de datos, ni tampoco un software o siquiera una metodología. Es un concepto: se entiende por Big Data a cualquier conjunto de datos tan grande que se dificulta el ser procesado por las herramientas tradicionales.

El punto clave siempre está en la enorme cantidad de información que debe procesarse y analizarse, y el poco tiempo que se dispone para lograrlo.

La cantidad de información almacenada en las bases de datos se ha multiplicado exponencialmente en los últimos años y la tendencia es que la explosión continué sin un techo demasiado claro.


Algunos de los beneficios de implementar una solución de Big Data son:

  • Identificar nuevas fuentes de ingresos.

  • Conservar y adquirir clientes.

  • Desarrollar nuevos productos y servicios.

  • Mejorar la experiencia.


El concepto de Big Data trae aparejados complejos algoritmos de manejo de datos, que permiten su procesamiento en segundos. En este artículo veremos uno de los más utilizados hasta el momento, a la hora de implementar una solución de Big Data.

Modelo MapReduce

El origen de este modelo, surge en el 2004 con Google, al tener necesidad de optimizar el proceso de ranking de páginas (pagerank).


MapReduce es un modelo de programación basado en procesamiento en paralelo en grandes bloques de informaciòn. La idea es distribuir el procesamiento de la información en diferentes nodos, que cada uno pueda ser trabajado en paralelo y luego se pueda obtener un resultado único.

En la etapa de "Map"o mapeo, se realiza un proceso de transformación y se dividen los elementos en pequeñas particiones más pequeñas que luego son enviadas a cada nodo de procesamiento.

En la etapa de "Reduce", se itera sobre cada valor asociado de la etapa de mapeo y se produce un resultado único.

Bases de datos NoSQL


Muchas de las nuevas aplicaciones requieren un volumen de muchos Terabytes de datos cuyo tamaño impide poder ser manejados con las BD tradicionales. Por eso han surgido las Base de datos NoSQL, que permiten resolver los problemas de escalabilidad y rendimiento que presentan estos tamaños tan grandes, mediante nuevos entornos de manejo de datos distribuidos y escalables de forma horizontal (muchos discos en paralelos).


Es una amplia clase de sistemas de gestión de bases de datos que difieren del modelo clásico del sistema de gestión de bases de datos relacionales (RDBMS) en aspectos importantes, el más destacado es que no usan SQL como el principal lenguaje de consultas.

Ventajas

  • Estos sistemas responden a las necesidades de escalabilidad horizontal que tienen cada vez más empresas.

  • Pueden manejar enormes cantidades de datos.

  • No generan cuellos de botella.

  • Alta velocidad de escritura de datos que se generan en tiempo real.

  • Escalamiento sencillo.

  • Diferentes DBs NoSQL para diferentes proyectos.

Ejemplos

  • Cassandra

  • Base de datos clave / valor..

  • Multiplataforma.

  • Creada por Apache.

  • Es una aplicación Java.

  • Sintaxis pseudo SQL (CQL).

  • MongoDB

  • Base de datos documental.

  • Open source.

  • Escrito en C++.

  • Redis

  • ​Base de datos clave / valor.

  • Está escrito en ANSI C.

Apache Hadoop

Es por excelencia la primer herramienta escrita en Java que surge de cualquier investigación a la hora de indagar plataformas disponibles para trabajar en Big Data. Ésta implementa MapReduce como modelo de programación para trabajo en grandes escalas. La idea de armar un proyecto para manejar grandes volúmenes de información que luego dio origen a lo que hoy conocemos como Hadoop.

Conclusión

En la actualidad analizamos apenas el 1% de los datos que circulan por el ambiente digital. El mercado de Big Data está claramente en crecimiento y seguirá así por los próximos años complementándose con otro concepto en auge y que veremos en el artículo que viene como Internet Of Things (IoT).

¿Te ha gustado este artículo? Compártelo en las redes sociales. ¡Muchas Gracias!

Comentarios


Entradas destacadas
Vuelve pronto
Una vez que se publiquen entradas, las verás aquí.
Entradas recientes
Archivo
Buscar por tags
Síguenos
  • LinkedIn Social Icon
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square

2016 © Weikopit. Todos los derechos reservados.

  • Grey Twitter Icon
  • Grey Facebook Icon
  • Grey LinkedIn Icon
Weikopit
bottom of page