Hola a todos!

Después del cambio de hora en nuestro país (en el cual, por motivos desconocidos, se dice que se ahorra en luz, pero todos salimos y volvemos a casa de noche), he decido escribir este post que durante mucho tiempo he tenido entre manos y hasta hoy no he podido redactar.

Como bien dice el título, se trata de una introducción a qué es el Big Data, qué representa y cuáles son sus conceptos; así que si eres un experto o tienes conocimientos avanzados sobre la materia, me parece que poco te voy a poder aportar 🙂

La primera pregunta que se suele hacer todo el mundo es: ¿Qué es el Big Data?

El Big Data (o lo que conocemos como tal) es un conjunto de tecnologías que nos permiten almacenar y procesar grandes cantidades de datos con el fin, obviamente, de mejorar la competitividad de nuestro negocio gracias al análisis de los mismos. Algo tan sencillo como esto.

Esta necesidad de buscar sistemas que permitan gestionar tamañas cantidades de información viene dada por la época en la que vivimos, el siglo XXI, o, como algunos lo llaman, «la sociedad de la información». Fijaos en vuestro alrededor: todo es información susceptible de ser analizada. Pero quizás la mejor forma de explicar esto es aportando un ejemplo práctico y sencillo.

Fuente: forbes.comSupongamos que tengo un negocio que consiste en vender tortillas de patatas online y necesito mejorar mis cifras porque la competencia me está comiendo terreno. ¿Cómo me puede ayudar el Big Data a hacer esto?

– Puedo analizar los precios de toda mi competencia a tiempo real y comparar con mis ventas, para tener una perspectiva real de mi negocio.
– Mediante las redes sociales y el análisis de lo que opinan de mi producto, así como de mi competencia, puedo tener una visión exacta de la percepción del mercado.

¿Imagináis la cantidad de datos que los dos puntos anteriores me pueden aportar? Solo contando opiniones de clientes o de potenciales consumidores probablemente tengamos decenas de TB. Y el análisis de toda esta información, ¿qué recursos de cómputo necesitará?

kk.jpg

Resumiendo todo esto, el Big Data me permite almacenar y analizar una cantidad ingente de información. Pero hay un aspecto tremendamente importante que no podemos obviar: el negocio. Y es que debe haber alguien, bien sea interno o externo a la compañía (preferentemente lo primero), que enlace la explotación de estos datos para que sean aplicables para mejorar la competitividad de mi negocio. Es decir, aplicar la capa de BI pero de una forma ágil y en un entorno global, en que la información externa es tan o más importante que la tuya propia.

Ésta es la clave y la utilidad de todo esto: apoyar y mejorar la toma de decisiones empresariales con datos.

Por si pensábais que el Big Data era «cosa de frikis» y que no tenía utilidad (os juro que lo he escuchado en más de una conversación), SAP ha realizado sus avances para unir el mundo de las aplicaciones enterprise y el Big Data.

Terminología y conceptos básicos

Como imagináis, el articulo podría ser infinito, especialmente en un ecosistema como éste, en el que lo escrito dentro de 6 meses habrá cambiado totalmente por la propia evolución de las tecnologías. Pero no quería terminar sin aportaros algunos conceptos básicos y rápidos para que todo esto no os suene a «chino»:

– Hadoop, como bien me lo definió un CTO de una multinacional, es un «cajón de sastre» donde puedo guardar y acceder a cualquier tipo de dato. Para ser fieles a la realidad, es un framework que me permite acceder y procesar información en entornos distribuidos.

– NoSQL son sistemas de bases de datos que, a diferencia de las tradicionales o relacionales (MS SQL, Oracle o DB2), no utilizan SQL como principal lenguaje de consultas y, sobre todo, soportan el almacenamiento de datos no estructurados. Son la respuesta a las necesidades de escalabilidad y crecimiento que necesitan muchas aplicaciones de Big Data. Es importante señalar que no vienen a sustituir (en principio) las bases de datos relacionales, dado que su propósito es otro. Entre las más destacadas están: MongoDB, Cassandra y CouchBase, entre otras.

– El científico de datos es la persona que establece el nexo de unión entre el análisis de los datos y su aplicación al negocio de cada compañía. Debe conocer profundamente tanto el negocio como las tecnologías de Big Data para poder aplicarlas con una clara orientación de competitividad y apoyo al negocio. En España, tenemos una auténtica eminencia de ello como es José Antonio Guerrero.

– Un lago de datos o Data Lake es un repositorio de datos listo para ser analizado. No obstante, a diferencia de la forma tradicional de almacenar en BD, los datos se guardan en bruto y en plano, cosa que permite que no hipotequemos cualquier posibilidad posterior de análisis o tratamiento. Como veréis, esto encaja perfectamente con Hadoop, es decir, con el concepto de almacén distribuido y un tanto abstracto.

Espero que este post os haya servido como introducción al mundo del Big Data de una forma muy simple y ligera y, sobre todo, aclarando qué es lo que nos puede aportar al día a día de nuestro negocio. Hay auténticos profesionales de este mundo que seguro os podrían aportar muchísimo más.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Post Relacionados: