//
Estás leyendo...
Bigdata

Dark data, la información que no es útil

Vivimos en un mundo controlado por las tecnologías de la información. La cantidad de datos que se registran y almacenan diariamente es ingente y su aprovechamiento a través de técnicas analíticas es cada vez más importante para cualquier tipo de negocio, que encuentra en ese universo de datos información muy valiosa que, adecuadamente explotada, puede ayudar enormemente a su desarrollo o a sus resultados.

Sin embargo, no es oro todo lo que reluce. Entre toda la información que se recoge y guarda existe una parte, muy importante, que nunca se llegará a emplear para nada, bien porque no contiene información útil, bien porque no se sabe o se puede utilizar. Esos datos basura permanecen almacenados junto con el resto creando un mar de datos (o data lake) en el que es necesario aprender a navegar para encontrar, entre toda la paja, los granos de información relevante tan valiosos hoy en día.

¿Qué es el dark data?

Según la consultora Gartner el dark data sería toda aquella información que las organizaciones recogen, procesan y almacenan durante los periodos habituales de actividad pero que normalmente no es de utilidad para ningún propósito.

Estudios realizados por IBM apuntan a que aproximadamente el 80% de los datos almacenados no son nunca aprovechados o incluso no son útiles de ninguna manera. La consultora IDC eleva este número por encima del 90% dando idea de que se registra una gran cantidad de información que nunca llegará a utilizarse.

Dark Data

Los motivos que llevan a este excesivo registro de información son diversos:
falta de análisis sobre lo que realmente se necesita recoger, naturaleza perecedera de la misma (aproximadamente el 60% de los datos recogidos pierden su valor inmediatamente después de ser registrados), información no estructurada que impide realizar un análisis adecuado de la misma… Pero en cualquier caso la conclusión es siempre la misma. Guardamos demasiada información que nunca utilizaremos.

¿Existe el dark data en el mundo de la salud?

Evidentemente, el entorno sanitario no está exento del registro innecesario de información en los sistemas informáticos. Seguramente todos tenemos en mente algún ejemplo de información que nos ha sido solicitada y que no comprendemos para qué puede ser necesaria en un momento dado.

No obstante el factor diferenciador que marcha la diferencia en el entorno de la salud es la utilidad clínica de la información que se recoge. En este sentido merece la pena ser conservador y registrar la mayor cantidad de información posible por si puede ser de utilidad en los procesos clínicos de los pacientes. La vida de una persona puede depender de un determinado dato etiquetado incorrectamente y es por ello que, a priori, decidir que un dato no será de utilidad en el futuro es, cuando menos, arriesgado.

¿Merece la pena registrar y guardar “por si acaso”?

Todos habremos pensado que, al menos en el caso de los datos sanitarios, merece la pena guardar la mayor cantidad de información posible por si algún día es de utilidad o se le encuentra algún valor. De ello puede depender la calidad de vida de los pacientes o incluso su propia vida en un futuro.

Y es cierto que podemos obtener algún tipo de recompensa futura de la cantidad ingente de información almacenada pero, ¿cuándo llegará ese día?. Nadie lo sabe y mientras tanto seguimos registrando información, almacenándola y preservándola, gastando un montón de recursos que podrían destinarse a otros usos.

A esto hay que añadir que en la mayoría de las ocasiones son los propios profesionales sanitarios los responsables de recoger y guardar en los sistemas de información todos los datos que se les solicitan, invirtiendo en ello una parte de su tiempo. Tiempo que, optimizando los recursos, podría destinarse a otras labores más provechosas para el sistema.

Analizar antes de recoger

Como todos habremos supuesto, la única solución realmente válida para reducir o minimizar el dark data sería el análisis previo de la información que los sistemas van a pedir o registrar tanto a los profesionales como a los pacientes.

Es cierto que a priori etiquetar un determinado dato como inútil es muy complejo, y en muchas ocasiones no será hasta mucho después de su recogida, cuando trate de emplearse en procesos analíticos, cuando nos demos cuenta de su utilidad. Pero es necesario realizar ese análisis, tanto previo como posterior, para prevenir en la medida de los posible una sobrecarga de información que incida negativamente tanto en los sistemas como en los profesionales.

Una de las grandes dudas que se plantean hoy en día en relación a los datos es la utilidad, presente o futura, de todo lo registrado. Es imposible saber a ciencia cierta si una determinada información que hoy guardamos podrá o no ser útil en el futuro dentro de algún proceso analítico o de explotación. Pero mientras tanto seguimos registrando y almacenando esa información, con el esfuerzo (tanto humano como económico) que supone. Quizás deberíamos pensar y analizar un poco más antes de acometer el registro masivo de información en nuestros sistemas.

¿Pensáis que el dark data existe en sanidad? Comentadnos vuestra experiencia.

Foto: HP

Anuncios

Comentarios

Aún no hay comentarios.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Introduce tu dirección de correo electrónico para seguir este Blog y recibir las notificaciones de las nuevas publicaciones en tu buzón de correo electrónico.

Únete a otros 3.217 seguidores

Archivos

A %d blogueros les gusta esto: