Dia MUNDIAL de la Informatica

La Ciencia de Datos y el Big Data requieren de un marco ético

¿Qué hay detrás de estos conceptos? ¿Qué sucede cuando se manipulan grandes volúmenes de información? ¿Por qué es necesario insistir en que se utilicen de modo correcto?

Escribe Fernando Aguada

Licenciado en Informática

Desde hace algún tiempo los términos Big Data y Ciencia de Datos resuenan con mayor insistencia en los distintos medios de comunicación y, como resultado, han ganado popularidad y comenzado a formar parte de nuestro vocabulario cotidiano.

Algunas de las implicaciones de su uso sin un correcto marco ético fueron puestos al descubierto en el reciente documental “The Great Hack” (Nada es Privado) acerca de Cambridge Analytica.

 

La información y la toma de decisiones

Para comprender qué se entiende por Ciencia de Datos, primero debemos definir qué es el Big Data. La empresa consultora y de investigación de las tecnologías de la información Gartner Inc. lo define como “activos de información de gran volumen, alta velocidad y/o gran variedad que exigen formas rentables e innovadoras de procesamiento de información que permitan una mejor comprensión, toma de decisiones y automatización de procesos”.

Un dato es la “representación simbólica de un atributo de la información de un objeto, persona, organización, etcétera”. Supongamos que deseáramos determinar la información de las personas: entonces podríamos considerar, por ejemplo, la edad, altura, género, color de ojos. Pero estos valores, aislados, no nos brindan información de importancia. Si los agrupamos y analizamos existe la posibilidad de encontrar algún valor o hecho relevante.

La denominación Big Data hace referencia a una gran cantidad de datos que, muchas veces, no se presentan estructurados (que no tienen un formato particular), y las capacidades de procesamiento de las herramientas tradicionales para su tratamiento resultan insuficientes. Big Data puede ocupar terabytes de espacio en distintos formatos, incluyendo texto, video, sonido e imágenes, entre otras.

Además busca aprovechar los datos y la analítica (análisis avanzado de datos) para mejorar los modelos de negocios en una organización. La analítica de datos es el examen autónomo o semiautónomo de datos, y utiliza técnicas y herramientas sofisticadas más allá de las que se emplean en la inteligencia de negocios tradicional (Business Inteligence). También tiene como meta descubrir conocimientos más profundos, hacer predicciones o generar recomendaciones. Y se divide en tres grandes análisis: descriptivo, predictivo y prescriptivo.

 

Generar conocimiento

Por su parte, la Ciencia de Datos es una disciplina por la que, mediante la manipulación de grandes volúmenes de datos (Big Data) y el análisis, utilizando a la vez herramientas tecnológicas o modelos matemáticos, es posible saber qué ha ocurrido, qué va a ocurrir o qué se podría mejorar (análisis descriptivo, predictivo o prescriptivo) con respecto a los datos.

Los proyectos de Ciencia de Datos se basan en la creación de modelos para el tratamiento y análisis de los datos con el objetivo de generar conocimiento. Estos modelos suelen volverse poco confiables con el paso del tiempo y se hace necesario un seguimiento y mantenimiento del mismo.

Para concluir, cabe añadir que la Ciencia de Datos es un término que abarca a la programación, la estadística, la minería de datos, el aprendizaje automático, la analítica de datos, la inteligencia de negocios, la visualización de datos e, incluso, otras áreas.

 

Homenaje a una pionera

Un 9 de diciembre de 1906, en Nueva York, nació Grace Murray: científica de la computación y militar estadounidense conocida por ser la primera programadora en utilizar el ordenador electromecánico Mark I, desarrollado por la multinacional de tecnología informática International Business Machines (IBM).

Asimismo, entre las décadas del 50 y 60 creó el primer compilador para un lenguaje de programación (COBOL) y propició métodos de validación.

Hoy es un homenaje a ella, llamada por sus amistades como “Amazing Grace”.

Más de
100%
Satisfacción
0%
Esperanza
0%
Bronca
0%
Tristeza
0%
Incertidumbre
0%
Indiferencia

Comentarios