PROYECTO DE UN EQUIPO APOYADO POR UNA AYUDA DE LA FUNDACIÓN BBVA

Inteligencia Artificial para diagnosticar COVID-19 en radiografías del tórax

PABLO JÁUREGUI

La Inteligencia Artificial ya ha demostrado en los últimos años que puede superar al cerebro humano a la hora de interpretar imágenes biomédicas para diagnosticar enfermedades como el cáncer de piel. Ahora, esta extraordinaria capacidad de las máquinas inteligentes puede convertirse en una poderosa herramienta para diagnosticar COVID-19 en menos de un segundo a través de radiografías del tórax. Este es el objetivo de un proyecto encabezado por Francisco Herrera, catedrático de Ciencias de la Computación de la Universidad de Granada e investigador principal del proyecto “Deep Learning and Smart data for Complex Problems”. que recibió una Ayuda a Equipos en Big Data de la Fundación BBVA en 2018.

2 junio, 2020

Convocatoria 2018

Ayudas a Equipos de Investigación en Big Data

“En este proyecto apoyado por la Fundación”, explica Herrera, “planteamos por un lado una línea teórica para entender cómo funciona la máquina inteligente, y después planteamos su aplicabilidad para interpretar imágenes en distintos escenarios, como por ejemplo en estudios de ecología y biodiversidad, detectando la presencia de plantas arbóreas, o en el campo de la seguridad, para detectar armas en grabaciones de vídeo. También aplicamos estos modelos para la extracción de conocimiento de texto, como las opiniones en redes sociales”.

Pero cuando empezó la pandemia, al igual que tantos otros grupos de investigación en todo el mundo, el profesor Herrera y sus colegas decidieron centrar sus esfuerzos en intentar aportar soluciones para afrontar este gran desafío médico. “Como tenemos relación con el área de radiología del Hospital Universitario San Cecilio de Granada, decidimos colaborar con el equipo de radiología que dirige el Dr. José Luís Martín, para desarrollar un sistema inteligente que pudiera detectar COVID-19 sobre una radiografía, en décimas de segundo”.

Una máquina de alta precisión

Tras dos meses de trabajo intenso, el equipo de Herrera ya ha comprobado que su sistema es capaz de leer las radiografías de los pacientes con mayor precisión que los radiólogos humanos. Según un estudio publicado en Radiology, la revista de referencia en este campo, los especialistas solo son capaces de detectar el 69% de los casos de COVID-19 en radiografías, así que cometen errores de diagnóstico en casi un tercio de los casos.

“En una radiografía torácica”, explica Herrera, “lo que indica la presencia de enfermedad es una mancha blanca en los pulmones, a veces en la parte inferior y en otras ocasiones como capa lateral blanca, y cuando se trata de un caso leve, es muy difícil de detectar”. Sin embargo, con el sistema inteligente que ha desarrollado su equipo con técnicas de aprendizaje automático (machine learning), la máquina está acertando en un 75-77% de los casos en diferentes experimentos realizados, y con diferentes niveles de acierto en función de la severidad de la neumonía presente en los pulmones como consecuencia del virus SARS-CoV-2.

“El nivel de acierto que estamos logrando con el sistema ya es significativamente superior al de los especialistas, aunque somos ambiciosos y queremos perfeccionarlo hasta llegar al 80% antes de implementarlo en la clínica, y también perfeccionar su comportamiento para la detección de las diferentes escalas de severidad de la neumonía asociada a COVID-19, con el objetivo de tener ratios de acierto por encima del 90% para una incidencia moderada de la neumonía en los pulmones”, afirma Herrera.

Una metodología muy robusta

Para desarrollar esta tecnología, su equipo ha trabajado con una base de datos de 300 radiografías de enfermos con diagnóstico positivo de COVID-19, que fueron cedidas para el proyecto por el Hospital San Cecilio, y otras 300 imágenes de pacientes sin la enfermedad.

“Lo esencial para lograr un sistema eficaz es la calidad de los datos, y nosotros hemos seguido un protocolo muy estricto”, explica Herrera. “Todas nuestras radiografías están validadas por test PCR que han verificado la presencia de la enfermedad en un paciente. En la actualidad estamos a la espera de disponer de mayor número de imágenes, lo cual permitirá que el modelo de aprendizaje alcance mayor robustez y también poder analizar las imágenes por segmentos de severidad de la enfermedad, analizando su mayor o menor incidencia en los pulmones”.

De hecho, el investigador señala que en estos momentos ya hay una empresa canadiense que está ofreciendo un sistema inteligente para diagnosticar COVID-19 en radiografías con un acierto en el 97% en su test, pero “hemos podido comprobar que han utilizado una base de datos pobre e incompleta con pocos casos positivos. Cuando analizamos su comportamiento con nuestras imágenes, la tasa de falsos positivos se acerca al 90%, y como se suele decir en nuestro campo, con respecto a la calidad de los datos, baja calidad de datos implica baja calidad de los modelos”.

“Nosotros queremos basar nuestro sistema en una metodología muy robusta y no lanzar las campanas al vuelo antes de tiempo”. La calidad de datos en big data (denominada “Smart data” en inglés) es precisamente el tema de estudio del último libro recién publicado del equipo de Herrera, “Big Data Preprocessing. Enabling Smart Data”. Esta cuestión fue analizada por su anterior proyecto, ‘Preprocesamiento de datos a gran escala (Big Data): modelos y herramientas para mejorar la calidad de los datos’, que también recibió una Ayuda a Equipos en Big Data de la Fundación BBVA en 2016.

Implementación clínica en otoño

Si las próximas semanas logran alcanzar el umbral del 80% de aciertos con su sistema, Herrera cree que podrían empezar a implementarlo en otoño, cuando muchos expertos consideran probable que se produzca un rebrote de la pandemia. El investigador señala que la técnica será especialmente útil en centros de salud y hospitales de ciudades pequeñas, que solo pueden recurrir a rayos X y no cuentan con otros sistemas de diagnóstico por imagen más sofisticados como el TAC (Tomografía Axial Computarizada).

“El TAC”, explica Herrera, “tiene una precisión del 97-98%, ya que con ella se obtiene una imagen en 3D del pulmón y se puede diagnosticar la enfermedad sin apenas margen de error. El problema es que esta tecnología solo está disponible en los grandes centros médicos, pero no en los pequeños hospitales y centros de salud”.

Por eso, su objetivo es que, gracias al nuevo sistema de Inteligencia Artificial, una radiografía le baste a un médico de familia en cualquier centro sanitario para diagnosticar de manera fiable un caso de COVID-19 en pocos minutos cuando éste ha afectado a los pulmones. “De esta manera se podrá activar rápidamente el protocolo cribado de pacientes y de aislamiento para los pacientes afectados”, asegura Herrera.

Una vez que se valide la eficacia de la técnica, se creará un portal web al que podrá acceder el técnico de radiología de cualquier centro de salud u hospital con una contraseña. Tras acceder a este portal, bastará subir la imagen radiológica y, en cuestión de segundos, el sistema le devolverá el resultado del procesamiento de la imagen para determinar si el caso es positivo o negativo.

“Hay que tener en cuenta”, señala Herrera, “que en los pequeños centros de salud, ni el técnico que realiza la radiografía ni el médico de familia tienen la formación para saber si un paciente tiene COVID-19 a partir de una placa por la dificultades comentadas. Nuestro sistema realmente podría hacer la función de un radiólogo en una primera fase, con una eficacia alta”.

Además, en una segunda etapa de investigación, el equipo de Herrera y el del Dr. Martín seguirán desarrollando el sistema para la mejora del análisis de los niveles de severidad que muestra cada imagen de los pulmones y sus posibles implicaciones clínicas, e incluso esperan poder ampliar su uso para analizar imágenes de otro tipo de neumonías, como las bacterianas y las víricas que no son COVID-19.

El potencial biomédico del ‘machine learning’

Esta investigación es un nuevo ejemplo del gran potencial biomédico que puede tener en la actualidad el machine learning como herramienta científica, un campo impulsado por Isabelle Guyon, Vladimir Vapnik, y Bernhard Schölkopf, los tres pioneros galardonados este año con el Premio Fronteras del Conocimiento en Tecnologías de la Información y la Comunicación. Gracias a los avances en este campo, las máquinas inteligentes pueden hoy ser entrenadas para clasificar conjuntos de datos con una precisión humana o, en ocasiones, incluso mejor.

“Ya se ha demostrado”, señala Herrera, “que la máquina es superior al ser humano en el análisis de imágenes biomédicas para el diagnóstico del cáncer de piel, al poder detectar detalles que no pueden detectar los expertos de carne y hueso. Eso no significa que vaya a sustituir a los expertos, pero puede ser una herramienta muy útil de apoyo en la toma de decisiones, con la ventaja de la rapidez del sistema de análisis, que es capaz de realizar el diagnóstico en menos de un segundo, a diferencia del especialista que necesita su tiempo, y además el nivel de precisión que cada vez es más alto para diferente enfermedades”.

El reto pendiente para el futuro, explica el investigador, es que además la máquina sea capaz de explicar sus propias decisiones, lo que se conoce como inteligencia artificial explicable, señalando, por ejemplo, qué es lo que ve en una imagen que le lleva a realizar un diagnóstico de COVID-19. “Todavía estamos lejos de esto”, concluye Herrera, “y es el gran reto actual de la inteligencia artificial – que la máquina te diga no solo si algo es A o B, sino que te explique por qué ha decidido que es A o B”.