Big data, la revolución de los datos masivos

Target, una compañía de descuento con cupones de Estados Unidos, envió una vez una promoción para mujeres embarazadas a una adolescente de instituto. Su padre, furioso, protestó ante la empresa inquiriendo si querían motivar a su hija a quedarse embarazada. Unos días después, cuando el responsable de la sección llamó al airado padre para pedir disculpas, fue éste quien se disculpó: su hija, realmente estaba embarazada. Target hace años que recopila, gestiona y deduce cosas de todos los datos que almacena de las compras de sus clientes. Con esos datos sobre compras registradas y un algoritmo informático la compañía es capaz de predecir cuales de sus clientas están en estado e, incluso, sabe la fecha prevista del parto con un razonable margen de error. Target y otras muchas empresas hace años que empezaron a almacenar todo tipo de datos sobre sus clientes. Los almacenan y procesan en un número tan exorbitante que están generando lo que los expertos llaman ya el mundo del ‘big data’. Bienvenidos a la época de los datos masivos.

Viktor Mayer y Kenneth Cukier han escrito un libro titulado Big data: La revolución de los datos masivos (Turner, 2013) en donde han recogido ese y otros muchos casos con los que explican de forma amena y clara lo que ellos consideran que va a ser una nueva era en el mundo, la de los datos masivos, que llegan a comparar con la que generó la imprenta de Gutenberg. Confieso que me picó la curiosidad sobre este libro tras leer en un artículo que era de las pocas obras de autores occidentales recomendadas por las autoridades chinas para la lectura de sus dirigentes este año. Tras leerlo entiendo que se incluyera en esa lista.

Portada de Big data

En esencia, Mayer y Cukier explican el fenómeno de la siguiente forma: hasta ahora, los estudios sobre datos se hacían en base a muestras más o menos amplias de datos que, debidamente estudiados, nos daban unos resultados y servían de base para buscar unas causas o explicaciones, pero en la era de los datos masivos el número de datos se acerca al máximo posible (ya no es una pequeña muestra) lo cual permite admitir que no sean tan correctos como deben ser las muestras y, además, ya no nos acercan al por qué de las cosas (a la causalidad) sino simplemente al qué sucede (la correlación entre variables). Esto tiene dos implicaciones: por un lado muchas veces es suficiente si averiguamos qué está sucediendo, si captamos la correlación entre las cosas, lo cual, además, es mucho más barato con los datos masivos recogidos por económicos sensores y analizados por los algoritmos de los ordenadores que una prolija investigación.

Es así como ya estamos siendo escrutados de forma minuciosa, muchas veces sin que nos lleguemos a dar cuenta. Y el fenómeno irá a más. Los ejemplos abundan en Big data: desde la acertada predicción del desarrollo de la gripe por parte de Google (mucho antes que lo puedan predecir los organismos oficiales) en función de las búsquedas registradas en su buscador; a saber lo que debe situar cerca de las cajas la empresa Wal Mart cuando se acerca un huracán (cajas de Pop-Tarts, un dulce para el desayuno). Analizando grandes cantidades de datos se encuentran correlaciones que, a simple vista, pueden pasar desapercibidas al ojo humano.

Esto es posible primero porque el precio de los sensores para recoger datos y de las memorias para almacenarlos han caído en picado en los últimos años. Eso cuando no lo pagamos los usuarios al comprar los aparatos (¿sabe cuántos datos pueden sacar las compañías telefónicas de sus llamadas y del uso de sus teléfonos o de su navegación por una pàgina web?).

Me interesa especialmente la aplicación de las tecnologías de los datos masivos en la gestión municipal. En Nueva York eran frecuentes las explosiones en el interior de las tapas del registro eléctrico debido a la vieja red de conducciones de la ciudad. Las tapas saltaban y volaban peligrosamente por los aires. Cruzaron datos de muy diferentes tipos para conseguir una predicción de qué tapas tenían más peligro de salir volando para así poder hacer una prevención mucho más acertada. Y lo consiguieron. En Nueva York, el alcalde Bloomberg creó una unidad para el análisis de los innumerables datos que se generan y almacenan en una ciudad. Tras un laborioso trabajo, el director analítico de la unidad y sus tres jóvenes científicos de datos han conseguido predecir aquellos edificios en los que el riego de que haya problemas parece más grave. De esta forma, los recursos se maximizan ya que se atiende antes aquellas situaciones que según apuntan todos los indicadores son susceptibles de convertirse en los problemas más graves. Todas las ciudades son susceptibles de predecir cosas con los datos de todo tipo que, de forma masiva, se generan en su territorio. Sólo hay que tener ‘mentalidad de datos’.

Claro que todo esto tiene sus peligros y sus posibles abusos, además de conllevar un cambio de mentalidad tanto en los científicos y analistas de datos como en las empresa, en los ciudadanos y en las propias leyes que rigen la privacidad. Los autores dedican un par de capítulos a este tema. En esencia, creen que la era de los datos masivos supondrá un cambio de rumbo: nos alejaremos de la responsabilidad individual de cada uno a ceder o no los datos y de la privacidad, para navegar hacia la responsabilidad de las empresas que utilicen esos datos, puesto que evitar que sean recogidos se convierte ya en una aspiración imposible en la práctica.

Sin duda una muy interesante lectura de por donde pasa ya nuestro presente y hacia donde va nuestro futuro porque no se engañen, participaremos todos con nuestros datos, aunque intentemos evitarlo.

.

DOCUMENTOS:

Reportaje sobre datos masivos en La Vanguardia basado en parte en este libro

//

Anuncios

6 comentarios el “Big data, la revolución de los datos masivos

    • Hola Rebeca. El enlace que pongo en el título del libro lleva a la web de la editorial, allí lo puedes comprar en línea o también descargarte un capítulo gratuito. Por supuesto es un libro que se puede encontrar en cualquier librería ya que es reciente. También existe el recurso de solicitarlo en alguna biblioteca, aunque tal vez todavía no esté en demasiadas.En Google books creo que se puede hacer una consulta limitada de páginas. Gracias por tu comentario.

  1. Hola Enric, no quería dejar de comentar sobre el libro que tuve la oportunidad de leer.

    Lo que más me gustó del mismo es el enfoque que este tiene. La mayoría de los libros sobre Big Data se centran en el mundo tecnológico del mismo.

    Lo bueno de este libro es trabaja sobre el impacto del Big Data en la sociedad y en el mundo en que vivimos y es por esto que tiene gran valor.

    El lector puramente técnico no se verá atrapado por el libro pero para quienes se quieran introducir en el mundo del Big Data y del valor que este puede otorgar es de lectura obligatoria.

    Excelente artículo.
    Carlos

  2. Hola Enric,

    Justamente he descubierto este libro hoy, en una librería, y aún no lo he leído pero por lo que dices promete bastante. Yo estoy leyendo este otro que a lo mejor tiene un enfoque distinto: “Principles of Big Data. Preparing, sharing and analyzing complex information” de Jules J. Berman, que aunque parece muy técnico por el título, en realidad no lo es (no sale ninguna tecnología concreta, ni ninguna fórmula: sólo los principios básicos). Es extremadamente recomendable y entre otras cosas enfatiza por qué big data no está solamente relacionado con el volumen masivo de datos; en realidad, hay otras dos características igualmente importantes para poder decir que algo es “big data”: la variedad de datos y la velocidad (se les llama las tres v-s del big data). La cuestión está en saber qué datos integrar y cómo hacerlo (superando barreras legales, de privacidad, etc, etc) para obtener el mayor valor posible de ellos. Además, tiene otra serie de implicaciones metodológicas mucho más profundas (el tipo de evidencia que puedes extraer del big data, distinta de lo que se podía hacer hasta ahora – esto, por ejemplo en Medicina, va a ser absolutamente clave), que cada vez dejan más patente lo importante que va a ser este tema en los siguientes años. ¡Gracias por escribir sobre este tema!

    • Un enfoque que parece interesante, sobre todo en las implicaciones para campos como la medicina. Gracias por tu comentario, Inés, que complementa sin duda mi entrada. Un saludo

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s