¿Entra basura, sale Evangelio?

En la antigüedad un oráculo era el medio por el que las personas recibían consejos sabios y detallados que procedían de los dioses.

Desde los tiempos de los asirios hasta los egipcios pasando por los más famosos homólogos griegos, los oráculos eran medios por los que los dioses hablaban a la gente. Para las personas de todas las civilizaciones interesadas en conocer el futuro o adoptar la decisión correcta, el oráculo era una manera de conocer lo desconocido.

En nuestra cultura moderna, los ordenadores y la tecnología se han convertido en los nuevos oráculos (hasta el punto de que grandes compañías han adoptado este mismo nombre, «Oracle»). Y con cada vez más cantidades de datos, la gente quiere conocer esos datos para predecir lo que va a pasar. Ahora, más que nunca, quieren su versión del oráculo de Delfos, una sacerdotisa que averiguaba lo que pasaría en el futuro.

Las compañías tecnológicas se han dado prisa en satisfacer esta vieja necesidad humana. En la actualidad, los nuevos oráculos son la inteligencia artificial (IA), el aprendizaje automático y los algoritmos de aprendizaje profundo.

Y no existe ningún otro ámbito en el que la IA resulte más atractiva que en la atención sanitaria; el potencial que tiene en relación con tratamientos y diagnósticos es prácticamente ilimitado. En muchos aspectos, tiene sentido: la atención sanitaria es un tema increíblemente amplio, una cuestión de alta complejidad que está cambiando rápidamente con nuevos avances tecnológicos.

Así pues, al igual que los antiguos griegos buscaban la sabiduría en Delfos, nosotros esperamos que la IA nos ayude a ver el futuro y nos permita tomar las decisiones correctas en materia de sanidad.

Pero inmersos en la IA y en el aprendizaje automático, la fiebre del oro en sanidad es la ley invariable de la computación: entra basura, sale basura (garbage in, garbage out). Es decir, los ordenadores solo son tan buenos como lo sean los datos que entran. Cuando se entrena IA con datos sesgados, lo que se consigue, obviamente, son resultados sesgados.

Para simplificar, no se puede llevar a cabo un aprendizaje profundo, un aprendizaje automático o impulsar la IA con datos que no existen o que son incorrectos.

Un ejemplo perfecto de errores debidos a datos no existentes [1]: un estudio del año 2015 sobre la efectividad de las técnicas de aprendizaje automático, utilizado para predecir qué pacientes de hospitales desarrollarían complicaciones debidas a la neumonía, funcionó bien en la mayoría de los casos. Pero el algoritmo cometió un grave error: indicó a los médicos que debían enviar a casa a pacientes con asma aún cuando estaban dentro de la categoría de alto riesgo. El protocolo del hospital era enviar automáticamente a pacientes con asma a cuidados intensivos pero lo que sucedió es que estos pacientes apenas aparecían en los registros de “pacientes con atención especial” con los que se entrenó al sistema.

Pedro Domingos, en su libro The Master Algorithm afirma que “a algunas personas les preocupa que los ordenadores sean demasiado inteligentes y conquisten el mundo, pero el problema real es que son muy tontos y ya han conquistado el mundo».

Para muchas organizaciones la esperanza de respuestas fáciles crea la consecuencia más grave que hemos visto en los comienzos de la IA y del aprendizaje automático: “entra basura, sale evangelio”. Como se ha señalado en muchos artículos, lo más importante de las iniciativas de aprendizaje profundo y computación cognitiva de hoy en día es que los éxitos están siendo bastante escasos. [2] Es decir, tenemos tantas ganas de creer en la promesa de estos nuevos oráculos tecnológicos que pensamos que por el simple hecho de utilizar las técnicas conseguiremos el conocimiento, una mejor atención y resultados mejorados.

Desgraciadamente, este no es ni ha sido nunca el caso.

Charles Babbage, el «padre de la computación», dijo en 1864 en su libro Passages from the Life of a Philosopher, “me han preguntado en dos ocasiones: `Sr. Babbage, ¿si se introducen en la máquina cifras equivocada los resultados serán respuestas correctas? ´ No soy capaz de entender el tipo de confusión de ideas que pudieron llevar a formular semejante pregunta.”

Así pues, ¿qué debe hacer una organización juiciosa para beneficiarse de la IA en el aprendizaje automático y mejorar la atención sanitaria?

Mi consejo para aquellas organizaciones que intentan aprovechar las nuevas tecnologías es simple.

 1. No crear “estrategia por nota de prensa”:

La estrategia de externalizar los datos o esperar que la IA pueda, por obra divina, solucionar complejos desafíos empresariales con una tecnología experimental y sin un plan es un gran error.

Se dice que los dos días más felices en la vida de un propietario de un barco son el día en que compra el barco y el día en el que lo vende. Lo mismo puede aplicarse a una estrategia de IA por nota de prensa. Está esa primera nota de prensa que anuncia el descubrimiento revolucionario y los problemas que deben solventarse. Después, está la segunda nota de prensa, que a veces no se envía nunca, anunciando la discreta paralización de un proyecto que resultó ser un fracaso.

Ninguna campaña de marketing sustituirá una estrategia sólida y el trabajo duro de la ciencia de los datos. Este comportamiento también vincula su estrategia de IA a un distribuidor en particular. Cuando anuncia que está haciendo grandes cosas con una tecnología específica de IA tiende a cerrarse en una única solución. La forma adecuada de considerar los sistemas de IA es que se trata de otra infraestructura tecnológica de la información, que debe ser modular para actualizar los componentes con facilidad. Igualmente, la estrategia de datos adecuada necesita estar implantada para soportar la acumulación y la normalización de los datos sanitarios a partir de varios sistemas para soportar la creación, el testeo y la implantación de algoritmos de aprendizaje automático en toda la organización. Este enfoque permitirá a las organizaciones beneficiarse de las innovaciones de la industria, a la vez que se reduce el riesgo de la obsolescencia de los sistemas de aprendizaje automático y se evita el coste de integraciones personalizadas.

Si desde el principio lo trata como una nave espacial rumbo a la luna, ¿está haciendo algo más que admitir un fallo de manera proactiva?

2. Tratar a las tecnologías de IA como alumno y no como maestro:

En el fondo, las tecnologías de aprendizaje automático y la IA replican las capacidades de aprendizaje y la cognición humana, solo que ellas lo hacen más rápido. Por lo tanto, si no tiene establecida una buena estrategia de aprendizaje, utilizar IA y el aprendizaje automático no va a ayudarle. Es algo que parece simple pero que, a menudo, pasa desapercibido. El otro aspecto importante es que debemos tratar a estas tecnologías como alumnos voluntariosos y ayudarles a crecer, y no como oráculos adivinatorios que todo lo saben sobre la dirección empresarial.

Cris Ross, el director de información de la Clínica Mayo, describió el estado actual de la IA de esta manera: «La inteligencia artificial es todavía bastante torpe y no lo digo de forma despectiva… Hoy en día, la mejor IA está totalmente dirigida por los llamados modelos semánticos, que consisten en comprender el lenguaje y las relaciones que tienen las palabras entre sí y cómo se combinan. Así pues, estas cosas solo pueden trabajar si se les dan enormes cantidades de datos en los que sumergirse para buscar y conseguir conexiones importantes desde el punto de vista estadístico, que pueden ser utilizadas para hacer ciertas interpretaciones. Así que es como un niño de 2 años que está aprendiendo a hablar y caminar e interactuar con el mundo. Si pongo la mano en la estufa el resultado no es bueno. No es algo que tenga claro de manera inmediata un niño de 2 años.»

No van a curar el cáncer, no van a acabar con el hambre en el mundo ni van a conseguir la paz sobre la faz de la tierra. Lo que pueden hacer es conseguir que los seres humanos sean más eficaces a la hora de procesar y analizar los datos correctos. Pero, para ser de ayuda, la IA necesita ser entrenada, así que lo mejor es tratarla como la neófita que es y establecer las condiciones adecuadas para que aprenda.[3]

3. Planificar su estrategia de datos. No hay nada que sustituya unos datos buenos:

Por último, no hay nada que pueda sustituir a unos buenos datos. Todos conocemos la ley invariable de la computación: GIGO (entra basura, sale basura). Y es ahí donde debemos centrar nuestra atención.

La IA no es un atajo para conseguir resultados mágicos con datos malos. Tal y como escribió John Bruno en Forrester recientemente en relación a la implicación de una nueva IA de Salesforce, Einstein, «el futuro de los procesos de venta basados en el análisis es prometedor, pero el camino para conseguirlo está lleno de retos. Los clientes actuales y potenciales de Salesforce deben ser conscientes de que las recomendaciones inteligentes requieren de un gran número de datos de calidad. Si entran datos pobres, saldrán recomendaciones pobres. La limpieza de datos y el continuo ajuste de las recomendaciones será vital para el éxito a largo plazo.[4]

Si tiene la ambición de impulsar cualquiera de las tecnologías en desarrollo existentes, debe saber que la IA depende en gran medida de gigantescas cantidades de datos. Esto significa que el único ámbito en el que esta tecnología es aplicable es aquel en el que existen abundantes datos y suficientemente profundos con variaciones limitadas.

Los datos preparan el camino para la IA y para poder cosechar los beneficios de la IA y del aprendizaje automático debemos establecer una estrategia de datos sanitarios. En lo relativo a la asistencia sanitaria, esto significa ir más allá de sus historias sanitarias electrónicas y sus almacenes de datos.

Para garantizar que tiene los soportes adecuados para iniciar cualquier esfuerzo relativo al aprendizaje automático o a la IA necesita una estrategia de datos sanitarios y una manera de gestionar realmente todos sus datos.

Es la única manera de asegurar que su nave llegue a la plataforma de lanzamiento.

 

Referencias:

[1] Caruana, R. et al. ‘Intelligible models for healthcare: predicting pneumonia risk and hospital 30-day readmission’ Proc. 21th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining1721–1730 (ACM, 2015).

[2] Davenport, Thomas H. “Lessons from the Cognitive Front Lines: Early Adopters of IBM’s Watson.” The Wall Street Journal. Dow Jones & Company, 03 Dec. 2015. Web. 15 May 2017.

[3] Parmar, Arundhati, Arundhati Parmar  |  1:42 Pm 10 mayo, Stephanie Baum  |  2:27 Pm 15 de mayo, Juliet Preston  |  2:15 Pm 15 de mayo y Erin Dietsche  |  10:31 Am 15 de mayo. “AI Is “still Pretty Dumb” y like a “2-year-old”.” MedCity News. N.p., 08 de mazo de 2017. Web. 15 de mayo de 2017.

[4] “John Bruno’s Blog.” Can Salesforce Really Prescribe An End-to-End Sales Process? | Forrester Blogs. N.p., n.d. Web. 15 de mayo de 2017.

 

InterSystems

InterSystems is the information engine that powers some of the world’s most important applications. In healthcare, business, government, and other sectors where lives and livelihoods are at stake, InterSystems has been a strategic technology provider since 1978. InterSystems is a privately held company headquartered in Cambridge, Massachusetts (USA), with offices worldwide, and its software products are used daily by millions of people in more than 80 countries.

Dejar comentario

*