Tecnología

Con ‘V’ de Big Data | Tecnología


Imagínese un futuro de ciencia ficción, en el que los humanos son controlados por un enjambre de datos individuales que cooperan formando una conciencia colectiva capaz de anticipar nuestros movimientos, decisiones y hábitos. Ese mundo de ciencia ficción puede ser este en el que vivimos, y a esa conciencia colectiva se la conoce con el reverente nombre de Big Data.

Pero, ¿qué significa realmente Big Data? Para definir la nueva deidad informática, los expertos emplean las llamadas “tres Vs”: volumen, velocidad y variedad. La primera V, volumen, indica que hablamos de tantos datos que no caben en un disco duro normal, ni siquiera en uno realmente grande. Hacen falta multitud de ordenadores conectados entre sí, formando lo que se acostumbra a llamar un clúster. Los miembros del clúster pueden estar repartidos por todo el mundo y conectados a través de internet, pero en la práctica las grandes empresas gustan de agruparlos en Centros de Datos, los Fort Knox modernos que almacenan el oro del siglo XXI, los datos. Por ejemplo, cuando suba su siguiente foto a Facebook, es posible que su imagen se aloje cómodamente en Lulea, localidad sueca próxima al círculo Polar Ártico, donde la compañía tiene uno de sus centros de datos emblemáticos. El frío ártico resulta en este caso un aliado que permite ahorrar enormes cantidades de dinero en refrigeración.

La segunda V, la de velocidad, nos habla de datos que llegan sin parar. Puede tratarse de tuits sobre un determinado tema que se están registrando para su posterior análisis, o datos que provienen de un sensor de presencia que emite una señal cada vez que alguien entra en un establecimiento.

Y esto nos lleva a la tercera V, la variedad. Un buen ejemplo lo encontró Google, cuando empezó a almacenar páginas web para su todopoderoso buscador. Resulta que había (y hay) páginas con formato para todos los gustos: con solo texto, otras con fotos o incluso con vídeos o música. Las bases de datos habituales, llamadas relacionales o SQL por el lenguaje de consultas en el que se basan, no cuadran bien en este entorno, porque exigen determinar de antemano un formato fijo para sus datos, en este caso el formato genérico de una página web. Por ello, Google creo su Big Table, una tabla gigante capaz de almacenar datos heterogéneos. Hoy en día los sistemas Big Data emplean a menudo almacenes de datos de este tipo, agrupados bajo el nombre genérico de “bases de datos NoSQL”.

Si nos hemos quedado con ganas de más Vs, podemos añadir una cuarta: veracidad, que más bien debería ser “falta de veracidad”, porque en este contexto se suele asumir que entre los datos puede haber algunos inexactos, o incluso incorrectos. Y no importa, porque para los análisis Big Data lo que cuenta no es el dato individual, sino el análisis del conjunto de datos.

Con todo su poder, Big Data no deja de ser una deidad menor al servicio del dios supremo del beneficio económico

Y ya lanzados, no debemos olvidar una quinta V, la de valor. Porque, con todo su poder, Big Data no deja de ser una deidad menor al servicio del dios supremo del beneficio económico, al que rinde culto mediante complejos análisis encargados de convertir los datos en tendencias y relaciones ocultas a nuestra pobre vista humana. Estos análisis ya son parte fundamental de la “inteligencia de negocio” de las grandes compañías, es decir que ayudan de forma significativa a tomar decisiones sobre el futuro de la empresa, lo que resulta a la vez admirable e inquietante.

Pero no debemos olvidar que el nuevo dios precisa para sobrevivir y crecer de las ofrendas que nosotros, sus fieles, le entregamos magnánimamente: los datos. Por ejemplo, seguro que todos hemos instalado alguna aplicación en nuestro móvil que nos ha pedido amablemente permiso para acceder a nuestra ubicación (que no necesita) a nuestros contactos (que no debieran importarle) o incluso a nuestras fotos (innecesarias para el funcionamiento de la aplicación). Pues bien, si en ese momento, llevados por el deseo de tener la nueva app, hemos pulsado “Aceptar”, tengamos por seguro que, en algún remoto centro de datos, el dios Big Data nos ha sonreído. Más datos gratis, gracias. 

Rafael Caballero es profesor contratado doctor de la Universidad Complutense de Madrid. 

Crónicas del Intangiblees un espacio de divulgación sobre las ciencias de la computación, coordinado por la sociedad académica SISTEDES (Sociedad de Ingeniería de Software y de Tecnologías de Desarrollo de Software). El intangible es la parte no material de los sistemas informáticos (es decir, elsoftware), y aquí se relatan su historia y su devenir. Los autores son profesores de las universidades españolas, coordinados por Ricardo Peña Marí (catedrático de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).




Fuente: El país

Comentar

Click here to post a comment