BigData: Retos y desafíos para el procesamientos de grandes volúmenes de información



"Análisis de Data que era previamente ignorada por limitaciones de la tecnología” - Matt Aslett"

DEFINICIÓN

Pues Big Data es la ciencia digital responsable de captar, ordenar, almacenar y analizar grandes volúmenes de información (peta-bytes/by day) provenientes de diversas fuentes. Con la finalidad de obtener insights para poder entender al cliente y su comportamiento y así ser capaz de proveer un servicio o producto específicamente dirigido.

Luego de haber definido Big data es necesario profundizar en las características. Comúnmente se logra por medio de las 4 V’s del Big data.

- Volume: Se refiere a la acumulación de gran cantidad de datos que se acumulan diariamente en una empresa. El verdadero reto no está en saber recopilar dicha información, sino en desarrollar un método continuo de recopilación y gestión del dato en directo.

- Variedad: Se refiere a las diferentes fuentes y tipos de datos tanto estructurados como no estructurados provenientes no solo de personas, sino de máquinas, sensores, software, etc. Esta variedad en datos no estructurados crea problemas de almacenamiento, minería de datos y análisis de la información.

- Velocidad: Se refiere a la rapidez a la que se generan los datos en la actualidad. Y a su vez a lo rápido que estos pierden utilidad.

- Veracidad: Se refiere a la calidad, la predictibilidad y la disponibilidad del dato. Es la variable menos uniforme y menos sencilla de controlar, debido a la dificultad de cerciorarnos de que un dato es 100% fiable.




Por otra parte, la estructura de los datos puede clasificarse en: 


i. Datos estructurados. Suelen encontrarse en tablas con columnas y filas de datos. La intersección de la fila y la columna en una celda tiene un valor y se le da una “clave”, a la que puede referirse en las consultas. 

Debido a que existe una relación directa entre la columna y la fila, estas bases de datos se denominan comúnmente bases de datos relacionales. Un punto de venta que almacena sus datos de ventas (nombre de la persona, producto vendido, cantidad, entre otros.) en una hoja de cálculo de Excel o un archivo CSV son ejemplos de datos estructurados.

ii. Datos semiestructurados. Tienen una organización, pero la estructura de la tabla se elimina para que los datos puedan ser fácilmente leídos y manipulados. Los archivos XML o un RSS para una página web son ejemplos de datos semiestructurados.

iii. Datos no estructurados. Se encuentran en todas partes: mensajes de texto, correos electrónicos y redes sociales, por ejemplo. Los datos no estructurados generalmente no tienen estructura organizativa y la tecnología BigData utiliza diferentes formas para agregar estructura a esta información.



Los retos de la adopción del BigData: 

El rápido cambio en el mundo de los datos ha provocado que las organizaciones luchen con la infraestructura tradicional, diversas tecnologías y la gestión de información. Los dispositivos productores de información como sensores, tabletas y teléfonos móviles continúan multiplicándose.

De esta manera, estas opciones de intercambio de información representan un tremendo reto para las organizaciones que buscan beneficiarse mediante el uso de técnicas de procesamiento tradicionales. Como resultado, los enfoques tradicionales han estado bajo presión.

Los desafíos que enfrentan las organizaciones que adoptan BigData incluyen:

• Los enfoques relacionales no son óptimos cuando se trata de una falta de estructura, velocidad de procesamiento a escala y costo asociado.

• Los recursos de visualización y análisis de datos no son capaces de manejar las representaciones correctas y  percepciones que los usuarios pueden descubrir de forma eficiente desde el big data.

• Las prácticas tradicionales de gobierno y gestión de la información no pueden hacer frente a las características del big data.

• Muchas organizaciones carecen de arquitectura, habilidades analíticas y talento necesarios para beneficiarse del cambio.

• Los silos de aplicaciones crean una desventaja en la habilitación efectiva de los negocios con información completa.

La economía de los datos se basa en la idea de que el valor puede extraerse a través del análisis. El big data está cambiando la forma en que los analíticos se ven comúnmente, desde la minería de datos hasta la analítica avanzada. 

Es importante tener en cuenta que está relacionada la analítica del big data con la inteligencia de negocios (BI), pero no son lo mismo. Big data analytics no es otra iniciativa de BI, sino que se basa en la inteligencia de negocios existente y trata de extraer información valiosa de los datos, no de transformar los datos en información mediante paneles e informes.

Christian Giovanni Zevillanos Begazo(2019) "BIG DATA : Definición, ecosistema y aplicación

ENCUMEX(2020) "Los retos del big data en una cadena de cambio" Recuperado de: https://thelogisticsworld.com/historico/los-retos-del-big-data-en-una-cadena-de-cambio/

Comments