domingo, 1 de marzo de 2015

El BIG DATA, ¿eres consciente de toda la información que suministras a las empresas?

Todos formamos parte de este gran crecimiento de los datos. El mundo gira en torno a los datos y la cantidad de datos que se almacenan sobre nosotros es inmensa. Esto se debe sobre todo al cambio que se está produciendo en el sector empresarial, y es que hace unos años el tendero tenía su tienda y conocía a los clientes de ir una y otra vez a comprar y el propio tendero ya conocía cuales eran los gustos de los clientes y les ofrecía lo que iban buscando incluso antes de que el cliente lo pidiese. Hoy día esto gracias a Internet ha cambiado, y si una empresa vende sus productos a través de internet necesita ir recabando información de los clientes para darles un trato más cercano al mismo.



Por tanto las empresas necesitan de estos datos, y es tal el volumen de información que manejan algunas, que podrían incluso analizar lo que sus clientes van diciendo de la marca o sus productos. Todo estos análisis hay quien piensa que son una pérdida de tiempo y que lo único que sirven es para restar tiempo a otras tareas que según ellos son prioritarias. Nada más lejos de la realidad, porque analizar estos datos en un momento dado puede ayudar a tomar decisiones en un negocio y que sean las correctas.
0301 Big data.jpg
En 2008 ya se comentaba que el Big data cambiaría la actividad económica mundial. Pues a día de hoy, ya se puede afirmar que la economía va guiada por los datos. Es muy necesario analizar los datos que podamos extraer de nuestros clientes, bien sea a través de la página web, una app movil geolocalizada, ejercicios de compra anteriores, etc.


Definición:

Es un término que hace referencia a un volumen de datos tal que supera la capacidad del software habitual para ser capturados en un tiempo más o menos razonable. Este problema se podría solventar mejorando el hardware, el inconveniente es que el desembolso económico sería importante, además de que la cantidad de información crece día tras día.


Los científicos de datos que es una persona con fundamentos en matemáticas, estadística y métodos de optimización, con conocimientos en lenguajes de programación. Además tiene experiencia en el análisis de datos reales y la elaboración de modelos predictivos. Estos científicos de datos hablan de las tres V del Big data que son:
  • Velocidad: Por que es necesario que los datos se procesen rápidamente, debido a su gran dinamismo. Por poner un ejemplo, si queremos captar nuevos clientes muchas empresas están utilizando las Apps geolocalizadas para lanzar e-promociones. Supongamos que tenemos una Hamburguesería y a través de una app geolocalizada, lanzamos ofertas a los clientes, si los datos no se gestionan con rapidez la promoción será mucho menos efectiva. Ya que no es lo mismo enviar una promoción a un cliente en un momento en que esté a unos 100 metros de nuestro local que hacerlo en un momento cuando el cliente incluso puede que ni esté en nuestra ciudad. Por que si está cerca, piensa pues mira, ya que estamos aquí vamos a acercarnos, mientras que si está lejos, no se va a tomar la molestia de ir a nuestro establecimiento. De ahí la importancia de procesar los datos con rapidez.
  • Variedad: Los datos que se recogen son muy diversos y son estructurados en diferentes formatos para facilitar el estudio de los mismos. Los datos se pueden almacenar en formato de audio, vídeo, sistemas GPS, numerosos sensores que se utilizan en la industria y en la agricultura. Siguiendo con el ejemplo anterior, lo que nos interesa realmente es la posición geográfica del cliente y sus gustos, no tiene mucho sentido que almacenemos datos como puedan ser su domicilio, ya que no le vamos a hacer repartos a domicilio. Pero en cambio sí que es muy importante conocer sus gustos, para que así las promociones enviadas sean con productos de su agrado. Esto lo trabaja muy bien Amazon, ya que los productos que te sugiere para que compres en su tienda online, siempre van en función de las compras que hayas realizado anteriormente. Y si es la primera compra que haces y/o búsqueda entonces los productos sugeridos son los más vendidos hasta el momento, así se aseguran que tus compras puedan estar entre estos productos. Tal es la importancia de los datos que más del 60% de las ventas realizadas en Amazon son de productos que el consumidor no iba buscando.
  • Volumen: El volumen de datos de la mayoría de las empresas alcanza tales dimensiones que no se pueden medir en Terabytes (TB), para que os hagáis una idea equivale a 1012 Bytes, sino que se mide en Zettabytes (ZB) que equivale a 1021 Bytes. La información que hay actualmente digitalizada es de 4,4 ZB y se prevé que para 2020 el tamaño de dicha información sea 10 veces superior, de 44 ZB.
0301 Big data 2.jpg.png


Ya se habla de otras V en el Big data:
  • Veracidad: Es importante que los datos sean correctos, sino pueden inducir a error en la toma de decisiones.
  • Valor: Consiste en sacar lo relevante de la información y que nos permita tomar las decisiones oportunas, para así convertir los datos en conocimiento.


¿Quien genera big data?

Cualquiera de nosotros con un dispositivo móvil, al usar una tarjeta de crédito, cualquier sensor de los que se usan por ejemplo en agricultura o en la indústria, generan un volumen de información de forma automática importante.


Cabe destacar que la industria del turismo está invirtiendo en Big data, ¿a que se debe esto? ¿es por supervivencia o es por un cambio de modelo? Es muy común que cuando vamos a un establecimiento, bien sea un restaurante, un hotel o cualquier otro y no nos tratan bien, muchos de estos consumidores que no se sintieron bien atendidos buscan alguna plataforma de internet (Facebook, Twitter, booking...) en la que dejar una crítica negativa al establecimiento. Igual pasa si la sensación es contraria, y creemos que nos han tratado demasiado bien. Lo cual para futuros clientes de estos establecimientos supondrá un handicap a la hora de decantarse por este establecimiento o por otro de la competencia.


Es difícil gestionar tal volumen de información, ya hemos citado los problemas de procesamiento anteriormente, además hay que añadir los de almacenamiento, etc. por eso Google lanza 2004 el paradigma MapReduce, que hemos de reconocer que actualmente no es el mejor pero sí el más estable o uno de los más estables y su funcionamiento es que divide la entrada de datos en paquetes y analiza cada uno por separado teniendo en cuenta las salidas de cada paquete para obtener un resultado final. La operación de mezcla, combina los resultados obtenidos de cada paquete para llegar al resultado final.


Existen algunas de las plataformas de pago para el análisis de grandes volúmenes de datos como pueden ser: Twistet, HaLoop, Spark o Distribute GraphLab entre otras. Aunque a recomendar alguna, nos quedaremos con HaLoop ya que permite el acceso gratis a MapReduce, permite también analizar todo lo referente a procesos iterativos, y además se pueden añadir librerías que permitan incorporar datos de otros programas. Hemos dicho que MapReduce es uno de los más estables, aunque no hemos olvidado que algunos algoritmos ya han demostrado que tiene algunas carencias con grafos.


Ejemplos de éxito en el análisis de datos

  • Google flu. El gobierno estadounidense intentó controlar el avance de la epidemia de gripe A por zonas, para minimizar las muertes por la misma dentro de sus estados. Esto lo consiguieron, pero tenían el problema de que los datos los eran analizados semanalmente con lo cual nunca llegaban a tener una visión real de cual era la situación de la epidemia. Google anunció que podía analizar el avance de la gripe A a través de las búsquedas que realizaban los internautas, teniendo así una visión más o menos cercana a la realidad y en tiempo real. Aunque no hemos de olvidar que tuvo problemas en 2013 por que hubo 2 focos de la pandemia y no se sabía muy bien asociar las búsquedas al avance de los 2 focos de la pandemia.
  • Cabe reseñar que Google utiliza más de 10.000 aplicaciones que utilizan Big data como pueden ser Google news, Blogger, Gmail, Maps, … además de controlar los dispositivos android que pueden controlar más información de todos nosotros de lo que podamos llegar a imaginar.
  • BBVA fue la primera empresa que permitió el análisis de datos bancarios casi en tiempo real.

En resumen, el Big data y la inteligencia de negocio en el ámbito empresarial te dotarán de ventajas frente a la competencia. Por tanto te que recomendamos que Analices los datos de tu empresa y mejores la eficiencia de los recursos de la misma.

No hay comentarios:

Publicar un comentario