//
Estás leyendo...
Bigdata

Riesgos del Big Data en la eSalud

Cada vez somos más conscientes de la importancia que hoy en día tienen el Big Data y los procesos analíticos aplicados a grandes volúmenes de datos. La gran mayoría de los sectores de actividad se están viendo afectados por estos procesos y la eSalud no es una excepción.

Todos los proyectos, incluyendo los relacionados con la analítica de datos pueden fracasar por diversos y muy variados motivos (mala gestión, inversión insuficiente, falta de experiencia o de conocimiento …) pero los proyectos de big data tienen sus propios factores de riesgo que conviene analizar antes de abordar uno de esta naturaleza.

Seguridad de la información

Hoy en día la información de salud es un recurso muy valioso y como tal, su seguridad debe ser la gran prioridad. Cuanto mayor sea la cantidad de información almacenada mayores son los riesgos de que dicha información pueda ser atacada por terceros.

En los últimos años hemos asistido a grandes escándalos relacionados con la seguridad de la información: casos como los de Evernote, eBay y Adobe son ejemplos de lo que puede suceder si no ponemos los medios suficientes para salvaguardar la información que almacenamos.

El mundo de la eSalud es especialmente sensible debido a la criticidad de la información que se recoge. Esto está generando un aumento de los ataques a entidades de salud, como el reciente caso de UCLA Health System, donde los datos de más de 4.5 millones de pacientes se vieron comprometidos.

Por este motivo y cuando nos planteamos iniciar un proceso donde vamos a trabajar con importantes cantidades de información debe ser imperativo implantar todas las medidas de seguridad necesarias para prevenir cualquier violación de seguridad sobre dichos datos.

Privacidad

Cercano a la seguridad, la privacidad de la información es otro punto de riesgo cuando trabajamos con datos de especial sensibilidad (sean muchos o pocos). Impedir el acceso a los mismos a cualquier persona no autorizada debe ser prioritario dentro de cualquier estrategia de recogida y almacenado de información sensible.

Además de las implicaciones legales que una filtración de información pueda suponer, debemos considerar así mismo la confianza que los pacientes depositan en las entidades a las que ceden sus datos. Si queremos que los pacientes nos cedan esta información, tan importante, debemos procurar demostrar que vamos a tratarla y a preservarla de la mejor manera posible y utilizarla únicamente para los fines para los que se ha cedido.

Coste

La recogida, almacenamiento, análisis y reporte de la información tiene un coste y éste no puede ignorarse. Todos y cada uno de los procesos relacionados con el big data puede y debe cuantificarse económicamente al comienzo de un proyecto.

Sin embargo cualquier desviación sobre los objetivos iniciales del proyecto puede generar una espiral incremental de coste que ponga en riesgo la consecución del proyecto.

Por lo tanto será especialmente importante determinar una estrategia inicial en el proyecto que mantenga bajo control el coste en cada una de las etapas del mismo. Fijar la cantidad de información a recoger, la forma de recogida y almacenamiento de la misma, eliminar información irrelevante e innecesaria para los objetivos finales … todos estos puntos deben ser abordados desde una estrategia inicial que permita mantener bajo control el presupuesto inicialmente asignado.

Poca calidad en la información

Ya hemos comentado con anterioridad que uno de los puntos clave en los proyectos de Big Data reside en la calidad de la información recogida y almacenada.

Hasta hace poco tiempo una de las máximas de los proyectos de esta naturaleza era: recoge todo lo que puedas que ya se analizará posteriormente. Esto ha generado que se pueda disponer de cantidades ingentes de datos que, o no se pueden utilizar, o son insuficientes o equivocados para los fines que se necesitan.

No se trata de registrar por registrar. Es necesario que ese registro se haga de forma organizada, de acuerdo a una estrategia y habiendo analizado con anterioridad que todo aquello de lo que se va a disponer es de utilidad, que no falta ni sobra nada. De otra forma nos encontraremos nadando en la inmensidad de un mar de datos del que será imposible salir.

Analíticas incorrectas

También es crítico, cuando ya disponemos de la información, elegir las preguntas adecuadas para los datos disponibles, determinar los algoritmos, los entornos y las plataformas que será necesario emplear. También hemos hablado con anterioridad de este tema aquí mismo.

Un ejemplo claro lo encontramos en el proyecto de Google relacionado con la gripe (Google Flu Trends). Basado en la información recogida sobre las búsquedas realizadas por los usuarios, inicialmente ofreció buenos resultados. Pero posteriomente, cuando éstos dejaron de ser tan exactos, se pudo comprobar cómo los algoritmos empleados no eran suficientemente precisos para detectar anomalías (más información aquí). Finalmente Google abandonó el proyecto, resultado en un sonoro fracaso.

Estos son algunos riesgos, los más importantes desde nuestro punto de vista, que los proyectos de big data deben afrontar desde el comienzo de los mismos pero estamos seguros de que hay más. ¿Cuáles identificas o has encontrado en un proyecto de esta naturaleza?

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: