El irresistible avance de los Big Data
autor: Mauro Campanella
Roberto Sanvito
fecha: 2016-09-01
fuente: L’irresistibile avanzata dei Big Data
Publicado en el n. 61 de Emmeciquadro
traducción: María Eugenia Flores Luna

La transformación en digital de los conocimientos permite una manipulación y elaboración a niveles de dimensión, complejidad y de costos bajos que no era posible hace sólo cinco años.

Se habla mucho de Big Data: una revolución en la gestión de la información, con efectos perjudiciales en todos los campos, desde la medicina, a la ciencia, a la vida privada y pública; también el mundo de la escuela será afectado por es.

El análisis de grandes cantidades de datos puede simplificar muchas actividades; pero es urgente desarrollar criterios de gestión responsables para gobernar un desarrollo que procede a una velocidad superior a aquella de la evolución cultural humana.

El desarrollo impetuoso de las tecnologías informáticas trae a escena nuevos instrumentos y nuevos fenómenos que están invadiendo, de modo siempre más penetrante, todos los aspectos de nuestra vida: no sólo las actividades laborales son transformadas sino el panorama cultural, la vida social y las relaciones interpersonales están sujetas a cambios a menudo no muy conscientes y responsablemente gobernados.

Quien trabaja en educación no sólo debe prestar atención a todas estas nuevas realidades, sino es solicitado a profundizarlas críticamente justo por el rol crucial que puede asumir la función educativa al preparar personas capaces de interactuar con los sistemas tecnológicos en modo eficaz y responsable. Uno de estos nuevos fenómenos es aquel de los llamados Big Data: para conocerlo mejor y comprender las implicaciones culturales y educativas hemos encontrado a Mauro Campanella, físico, responsable de Investigación & Desarrollo del GARR (red nacional a banda ultra-ancha dedicada a la comunidad de la instrucción e investigación).

Iniciamos con una aclaración de los términos: ¿qué se entiende por Big Data?

La posibilidad de transformar en número cada aspecto de la realidad, como imágenes, sonidos, exámenes médicos, dinero, ha hecho posible representarla en información digital, o más brevemente, al inglés, data. El desarrollo y la sistemática difusión de la tecnología digital, como los celulares, y la transmisión de los datos casi han anulado el costo del archivar y ha permitido la transferencia (vía Internet) a todo el mundo en modo instantáneo y a bajos costos.

Los Big Data son el conjunto de todos estos números que vienen de muchas fuentes. Fuentes inagotables relacionadas con las personas son las aplicaciones sociales como Whatsapp y Facebook, y nuestros teléfonos (los números llamados, nuestros movimientos, los datos producidos por los app que usamos, las búsquedas en Internet), pero también nuestras tarjetas fidelidad, las tarjetas de crédito.

Los Big Data son también datos impersonales, como el tráfico vial, el número de pasajeros en una metropolitana, el número de piezas producidas del LEGO, los repuestos y su cantidad en el almacén, los números de serie de las entradas al cine etc., en cualquier situación en que sea producida información digital.

Esta enorme cantidad de información, en constante crecimiento aún no agregada y clasificada es llamada Big Data y es considerada un tesoro bruto del cual obtener resultados científicos, conocimiento y riqueza.

¿Cuándo se comienza a hablar? ¿Y por qué sólo hoy se han vuelto tan importantes?

El conocimiento siempre ha sido una riqueza y una fuente de poder. A partir de la mitad del siglo XX la tecnología había vuelto simple y económico producir y memorizar información. Hacia el año 1995 la memorización digital se vuelve más económica que el papel y mucho más compacta. Desde el año 2000 casi toda la información es producida digitalmente y el término Big Data inicia a ser usado ampliamente.

Hoy la transformación en digital del conocimiento permite una manipulación y una elaboración a niveles de dimensión, complejidad y bajos costos que no eran posibles hace sólo cinco años. Esta revolución en la gestión de la información tiene un efecto perjudicial en todos los campos, desde la medicina, a la ciencia, a la vida pública y privada.

¿Qué quiere decir pues usar los Big Data?

La enorme cantidad de datos brutos producida tiene una utilidad intrínseca y por eso está conservada en memorias digitales: es posible así, por ejemplo, recordar cada número de serie de un objeto y su comprador por la garantía o el pago del gasto en la caja. Pero es cuando estos datos vienen indexados, analizados, correlacionados entre sí que se descubre la verdadera utilidad y el interés de los Big Data. Por ejemplo, analizando los recibos de las autopistas se puede estadísticamente prever el tráfico en días futuros y el flujo (entrada y salida) de los vehículos. Tal previsión permite decidir cuántas casetas de peaje abrir en cada salida para disminuir las colas de los vehículos que transitan; los mismos resultados son útiles para las gasolineras para planificar las reservas, a la policía para organizar el control.

Mayor es el número de datos recolectados, mayor es la precisión de los cálculos. Analizando las ventas en un supermercado se planifican los suministros, se comprende el gusto de los clientes, se crea la estrategia para la publicidad y el cambio de los productores. El análisis puede cruzar datos en cantidad siempre mayor y con algoritmos muy sofisticados y que son capaces de encontrar relaciones que no serían obtenibles manualmente.

El análisis de los Big Data produce otros datos, por ejemplo el índice de los mismos datos, que son normalmente llamados metadatos, que contienen un valor agregado aún mayor.

Los motores de búsqueda como Google son los principales usuarios del Big Data. Indexan y asignan una importancia a las informaciones que tienen, partiendo de las palabras individuales. Esta tarea es titánica y es desarrollada automática y constantemente por calculadoras en todo el mundo. La red Internet permite a todos los centros de Google actualizarse reciprocamente.

La presentación del resultado de una investigación depende pues de algoritmos y pesos que no necesariamente son neutros, sino pueden proporcionar mayor importancia a algunos resultados en base a acuerdos económicos o políticos. En este sentido todos los resultados van siempre interpretados y comparados.

De hecho, el análisis de los Big Data y el desarrollo tecnológico están creciendo en modo sinérgico: tanto más las calculadoras se vuelven veloces y miniaturizadas, las memorias tienen más capacidad y la red más extensa, tanto más es simple recoger y analizar gran cantidad de información.

¿De qué dimensión de datos se está hablando?

Los datos se crean tan fácilmente que su cantidad es mucho más que «grande» (big) y aumenta constantemente. Se piense en un solo supermercado y a todas las informaciones de los almacenes, de las ventas y de los recibos conectados cada uno a una tarjeta fidelidad: millones de números cada día. Una cantidad muy superior a los miles de millones en poco tiempo y sólo para aquella tienda.

Hoy el disco de una computadora, como la que usamos normalmente, contiene 500 millones de caracteres (byte) y un número decimal ocupa en media 4. Fácilmente los centros donde los datos son archivados tienen millones de discos, cada uno de los cuales contiene también 4000 o 8000 mil millones de caracteres.

¿Dónde «se encuentran» estos datos y quién los gestiona?

Los datos están en todas partes, generados para todo objeto que contenga electrónica y que pueda comunicar. Cada uno de nosotros es propietario de objetos y gestor de una parte de los datos, incluso películas y fotografías.

La tendencia es reagruparlos, para simplificar la gestión y optimización de los costos, en grandes centros, donde además de los datos hay calculadoras y veloces redes de transmisión. Estos centros son los elementos base de sistemas hoy conocidos como sistemas de cloud (nube). Su gestión es a menudo de entes privados, como Google, Facebook, Amazon, Dropbox.

El mundo de la investigación ha creado verdaderos centros de cálculo dedicados a la recolección y análisis de los datos científicos. Grandes cantidades son generadas por ejemplo por los experimentos de física de las partículas en el CERN de Ginebra (http://home.cern/about/ computing), para la observación astronómica, para la biomedicina.

Por tanto hay una estrecha relación con Internet…

Sí, muy estrecha. Internet es el instrumento base de la creación del modelo de servicios llamado precisamente nube; permite estar siempre «en red» y escindir la ubicación física de la información respecto a aquella del usuario. Hoy se pueden consultar trámite la red los libros de una biblioteca, ver películas y leer exámenes médicos cómodamente sentados en casa por ejemplo.

La nube adopta un modelo de gestión de datos físicamente centralizado, pero con sus usuarios físicamente distantes y conectados a alta velocidad vía Internet. La nube mueve también las capacidades de cálculo cerca de los datos, permitiendo también el análisis y la aplicación y no sólo la consulta.

¿Qué tipo de infraestructura necesitan los Big Data?

El «dato» es el elemento base del mundo digital y viene almacenado en discos magnéticos o en estado sólido (estos últimos cerca de diez veces más veloces que aquellos magnéticos). Estos dispositivos requieren potencia eléctrica, ambientes a temperatura condicionada, limpios y protegidos de intrusiones, aun físicas.

Muchos data center están alojados en edificios amplios, especialmente equipados y conectados al externo por circuitos múltiples a muchos millones de bit por segundo. Es sin embargo posible y útil hacer un pequeño centro de datos también en una escuela, donde se pueden hospedar en una habitación cerrada y condicionada sea las calculadoras como los discos y conectarlos a la red.

¿Cuáles son actualmente las áreas de aplicación más interesantes?

El análisis permite llevar innovación a cada campo. En perspectiva el mayor impacto se prepara a nivel social: en el campo médico a través del cruce de resultados de múltiples pacientes, en la optimización del uso de la energía eléctrica, de transportes, de seguridad.

El mundo de la investigación ya está utilizando provechosamente el análisis de los Big Data en varias disciplinas. Para la educación el impacto será el resultado de una evolución de métodos didácticos que sepan aprovechar adecuadamente Internet y Big Data.

¿Cuáles las interacciones con otros segmentos tecnológicos?

Aun en este caso es muy estrecha y portadora di cambios. La disponibilidad de espacio de conservación y cálculo a altos rendimientos ya ha llevado a tecnologías como el reconocimiento vocal y de comandos como SIRI de Apple y los automóviles que se conducen solas.

Sistemas similares, además de poderse basar en los Big Data y en reglas gramaticales, usan lógica avanzada para entrar en el significado de la frase. La inteligencia artificial se aplica en forma de aprendizaje a través de la elaboración continua en los Big Data y al resultado de las acciones emprendidas.

¿Qué cambios potencialmente pueden ser inducidos, a nivel social, industrial, cultural?

Estamos sólo al inicio de los cambios que se prefiguran profundos en cada campo. Los frutos del uso de la tecnología de los Big Data pueden ser positivos, pero también negativos.

Del lado positivo, es probable una mayor automatización y optimización de todos los aspectos prácticos de la vida como un mejor uso de la energía, cuidados médicos más eficaces y eficientes, una agricultura más respetuosa del ambiente.

A nivel social, la cantidad de datos disponible a la administración pública podría simplificar muchos trámites y aumentar la eficiencia del sistema.

A nivel industrial una mayor eficiencia y automatización de los procesos productivos y velocidad en el cambio, a pesar de una mayor invasión en la vida privada para proporcionar publicidad personalizada. La publicidad personalizada es el resultado de un análisis de datos recogidos por los hábitos de consumo de la persona. Tales datos vienen obtenidos por ejemplo a través del uso de tarjetas fidelidad y tarjetas de crédito, pero también por el interés en productos que se han buscado en Internet o por interés derivado de los social network. Tales informaciones son intercambiadas con costo entre las empresas interesadas.

Están en fase de prueba automóviles capaces de manejarse solas, un aplicación que une el uso de los Big Data para los mapas viales con la inteligencia artificial.

A nivel cultural, la digitalización de todas las obras e informaciones históricas del pasado está lentamente continuando. Tal obra es lenta porque requiere que, manualmente, las informaciones presentes en papel u otros soportes sean digitalizadas transformándolas en imágenes y haya pues un eventual proceso de reconocimiento del texto que permita completar la digitalización para la investigación. La facilidad de acceso a los datos, los análisis y el cruce de información es el desafío cultural de los próximos años.

Por último, a nivel personal el cambio será consecuencia del uso de los Big Data por parte de organizaciones públicas y privadas, que influenciarán nuestras vidas. Viviremos en un ambiente más rico de comunicación interpersonal, pero ciertamente más invasivo.

¿Hay elementos de preocupación y se puede hablar de riesgos potenciales?

La existencia de los Big Data y su uso son una novedad y la comprensión y por tanto el control de la tecnología están aún en la fase inicial.

La tecnología tiene un potencial muy alto para generar información por deducción en cada aspecto de la realidad, en su futuro y por tanto en cada persona. Por tanto hay riesgos para la esfera personal y es necesario que el mantenimiento de los datos y su uso vayan incluidos en las consecuencias y honestamente regulados; al momento aún no han sido desarrollados una ética, una cultura y un conjunto de reglas que permita usarla mejor.

Además a menudo los datos y los metadatos no son archivados en el país en que son producidos y por tanto sujetos a la legislación local. Google ha debido hacer acuerdos con varios estados sobre qué informaciones poner a disposición de los ciudadanos de aquel estado, haciendo el acceso a la información menos transparente.

Además de la comprensión del uso de datos en el presente y en el pasado, va también incluido cómo evaluar correctamente las previsiones basadas en un Big Data y algoritmos, para no pensar que sean necesariamente ciertas. Por ejemplo, las previsiones meteorológicas están volviéndose más precisas, pero son siempre probables y nunca ciertas.

¿Qué se puede decir en tema de privacy y de control personal?

La privacy es un aspecto ya parcialmente protegido por la ley, pero es necesario hacer más y continuar a actualizar las leyes y la cultura, sobre todo nuestra comprensión. El vivir en modo digital, crea informaciones que son recopiladas constantemente por muchos entes.

El celular que llevamos siempre con nosotros es seguido constantemente y proporciona información sobre nuestra posición, las búsquedas en Internet que realizamos proveen informaciones sobre nuestros intereses y costumbres, participar en las redes sociales de Facebook o Twitter provee informaciones sobre nuestras conexiones y naturalmente pone a disposición nuestras opiniones y todo lo que volvemos permanente confiándolo a Internet.

Por consiguiente son mantenidos prudentes comportamientos relacionados a los datos personales también para evitar robos de identidad, por ejemplo no botar en el contenedor de papeles los datos bancarios.

Primero nosotros debemos proporcionar sólo información que estemos dispuestos a compartir. También porque por ahora Internet mantiene todas las informaciones, para siempre. El derecho y la posibilidad del olvido deben aún ser introducidos coherentemente.

Los datos del ADN de cada uno son un ejemplo extremo de la información que puede ser analizada y proveer previsiones e informaciones muy personales y delicadas. Por ejemplo la probabilidad de desarrollar una patología. Dada la cantidad de informaciones que están disponibles en cada uno de nosotros aun indirectamente, por ejemplo a través de las registraciones de cámaras en lugares públicos, es, en efecto, posible obtener con mucha precisión el comportamiento de una persona, teniendo acceso a los datos y suficientes recursos de cálculo. Las exigencias de la privacy deben ser balanceadas con los controles que, por ejemplo, el terrorismo ha hecho necesarios.

¿Se puede decir que estamos yendo hacia una organización social siempre más dependiente de la técnica?

¿El ser humano de «guardián de la creación» está volviéndose «guardián de las máquinas»? Probablemente sí, la nuestra ya es una sociedad «frágil», por ejemplo por su extrema dependencia de la energía además de la tecnología. Los datos pueden simplificar el trabajo de todos, pero también se requiere la voluntad de simplificar lo más posible la cantidad de datos que producimos y que son requeridos.

Personalmente, como hombre que quiere comprender el mundo, respetándolo, creo que las nuevas tecnologías sean un instrumento esplendido para elaborar nuestro conocimiento. En este sentido también el conocimiento del instrumento debe aumentar, así como la capacidad de usarlo con seguridad. Una tarea no fácil, porque el desarrollo tecnológico es mucho más rápido que los tiempos humanos de gestión de la innovación a través de la cultura.

Los Big Data y su análisis son una ocasión única de mejoramiento sea de la vida cotidiana sea del conocimiento. Una moral y una ética relativas al uso de informaciones importantes, como por ejemplo aquellas del ADN, deben desarrollarse rápidamente para minimizar los efectos negativos: estas tecnologías tienen el potencial de cambiar profundamente al ser humano.

-
Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License