Big data: conocimiento sí, acecho no

El caso de Cambridge Analytics no permite que se engañe nadie: minar datos en redes sociales conlleva una responsabilidad ética y legal que pasa en principio por la transparencia: Informar al usuario que se recopilarán determinados datos, durante un tiempo específico para un fin determinado.

La semana pasada el escándalo de Cambridge Analytics nos hizo reconsiderar nuestra permanencia en Facebook. Cambridge Analytics, que no está vinculada a la prestigiosa Universidad de Cambridge, es una empresa inglesa que analiza datos para desarrollar campañas para marcas y políticos, y obtuvo -gracias a las generosas políticas de intercambio de datos que los desarrolladores de aplicaciones de Facebook disfrutaron en 2014- los datos personales de 50 millones de usuarios de Facebook a través de una aplicación de personalidad que desarrolló un académico. La noticia puso bajo el reflector las movedizas fronteras en las que se desenvuelve la privacidad, los datos personales y las redes sociales. Sobre el escándalo Facebook ya empieza a pagar las consecuencias: sus acciones en la bolsa tuvieron el mayor descenso en años y posiblemente Zuckerberg mismo sea citado a comparecer ante el Congreso. Todo parece indicar en que el mea culpa que hizo a través de una carta publicada en The ObserverThe Sunday TimesMail on SundaySunday MirrorSunday Express and Sunday TelegraphThe New York TimesThe Washington PostThe Wall Street Journal, entre otros tantos, no será suficiente.

Un desafortunado efecto colateral de este escándalo es la satanización del Big Data. A lo largo de la semana junto con el hashtag #DeleteFacebook vi pasar en varias ocasiones el de #FuckBigData y no puedo resistirme a esbozar aquí una breve defensa.

El Big Data se originó en la física y la astronomía ya que al ser el Gran Colisionador de Hadrones y el Conjunto de Kilómetros Cuadrados dos colectores masivos de exabytes de información fue necesario desarrollar instrumentos que permitieran manipular la cantidad ingente de datos que producían. Pronto las ciencias sociales comprendieron su potencial.

Aunque no existe una definición “definitiva” de qué es Big Data suelen utilizarse las características distintivas que Laney Gartner ofreció en un reporte de 2001 titulado 3D Data Management: Controlling Data Volume, Velocity and Variety: volumen, velocidad y variedad[1].

Es difícil decantarse por solo un par de ejemplos de lo mucho que hemos aprendido gracias al Big Data, pero en Los Ángeles California ha contribuido a mejorar el sistema de tránsito y también se están viendo avances importantes en el cuidado de la salud y los hospitales, pues con el Big Data es posibles pasar de un enfoque reactivo a uno más preventivo/proactivo siguiendo a los pacientes en el hospital y de forma remota.

Pero no me engaño y el caso de Cambridge Analytics no permite que se engañe nadie: minar datos conlleva una responsabilidad ética y legal que pasa en principio por la transparencia: Informar claramente al usuario que se recopilarán determinados datos, durante un tiempo específico para un fin determinado.

Hay una frase muy conocida que dice If you’re not paying for it; you are the product y durante mucho tiempo se asumió como una patente de corso para que tomaran nuestros datos. Obviamente no lo es. Facebook ahora o solo tendrá que rendir cuentas y volverse a ganar la credibilidad sus usuarios, sino demostrarnos que mina nuestros datos para mejorar nuestra experiencia, no para acecharnos.

 

@yamilnares 

Referencias:

  • [1] Volumen: Gran cantidad de datos disponibles para el análisis. Este volumen de datos está impulsado por el creciente número de instrumentos que recopilan información (herramientas de redes sociales, aplicaciones móviles, sensores) así como por la mayor capacidad de almacenarlos y transferirlos.
  • Velocidad: Esto se refiere tanto a la velocidad a la que pueden ocurrir los eventos de recopilación de datos, como a la posibilidad de administrar grandes flujos de datos en tiempo real.
  • Variedad: Esto se refiere a la complejidad de los formatos en los que puede existir el Big Data. Además de las bases de datos estructuradas, existen grandes flujos de documentos no estructurados: imágenes, correos electrónicos, videos y enlaces entre dispositivos y otros formularios que crean un conjunto heterogéneo de información.

 

Close
Comentarios