BIG DATA

Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles. Esto se debe a que el Big Data es un proceso que realiza el análisis de grandes volúmenes de datos. Estos análisis, a su vez, generan información muy valiosa que se puede aplicar en diferentes ámbitos de tu negocio.


Aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo, la mayoría de los analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes. La naturaleza compleja del Big Data se debe principalmente a la naturaleza no estructurada de gran parte de los datos generados por las tecnologías modernas, como los web logs, la identificación por radiofrecuencia (RFID), los sensores incorporados en dispositivos, la maquinaria, los vehículos, las búsquedas en Internet, las redes sociales como Facebook, computadoras portátiles, teléfonos inteligentes y otros teléfonos móviles, dispositivos GPS y registros de centros de llamadas.


En la mayoría de los casos, con el fin de utilizar eficazmente el Big Data, debe combinarse con datos estructurados (normalmente de una base de datos relacional) de una aplicación comercial más convencional, como un ERP (Enterprise Resource Planning) o un CRM (Customer Relationship Management).


Por definición, el Big Data son conjuntos de datos de gran variedad, que se generan en grandes volúmenes y a una velocidad cada vez mayor. Por eso, cuando hablamos del Big Data, siempre mencionamos las tres “V” del Big Data. Bueno, en realidad ahora hay más de tres “V”, porque el concepto del Big Data ha evolucionado, pero eso te lo explico más abajo.


¿Sabías que el motor de un avión genera más de 10 terabytes de datos en solo 30 minutos de vuelo? ¿Y cuántos vuelos hay en un día? Esto hace que cada día haya varios petabytes nuevos de información. Las cargas de fotos y vídeos, los mensajes y los comentarios en Facebook generan varios cientos de terabytes de datos nuevos a diario. La suma de todo esto hace que haya un montón de datos, ¿verdad? Pues eso es a lo que llamamos Big Data.