{{{sourceTextContent.subTitle}}}
Las comunidades se benefician del intercambio de conocimientos y experiencias entre sus miembros. Siguiendo un principio similar -llamado "aprendizaje de enjambre"-, un equipo internacional de investigación ha entrenado algoritmos de inteligencia artificial para detectar cáncer de sangre, enfermedades pulmonares y COVID-19 en datos almacenados de forma descentralizada. Este enfoque tiene ventajas sobre los métodos convencionales, ya que proporciona de forma inherente tecnologías de preservación de la privacidad, lo que facilita el análisis transversal de los datos científicos.
{{{sourceTextContent.description}}}
De este modo, el aprendizaje enjambre podría promover y acelerar considerablemente la colaboración y el intercambio de información en la investigación, especialmente en el campo de la medicina. Expertos del DZNE, la Universidad de Bonn, la empresa de tecnología de la información Hewlett Packard Enterprise (HPE) y otras instituciones de investigación informan de ello en la revista científica "Nature".
La ciencia y la medicina son cada vez más digitales. El análisis de los volúmenes de información resultantes -conocidos como "big data"- se considera clave para mejorar las opciones de tratamiento. "Los datos de la investigación médica son un tesoro. Pueden desempeñar un papel decisivo en el desarrollo de terapias personalizadas que se adapten a cada individuo con mayor precisión que los tratamientos convencionales", afirma Joachim Schultze, director de Medicina de Sistemas del DZNE y profesor del Instituto de Ciencias Médicas y de la Vida (LIMES) de la Universidad de Bonn. "Es fundamental para la ciencia poder utilizar esos datos de la forma más exhaustiva y a partir del mayor número de fuentes posible"
Sin embargo, el intercambio de datos de investigación médica entre distintos lugares o incluso entre países está sujeto a la normativa sobre protección y soberanía de datos. En la práctica, estos requisitos sólo pueden aplicarse con un esfuerzo considerable. Además, existen barreras técnicas: Por ejemplo, cuando hay que transferir enormes cantidades de datos por vía digital, las líneas de datos pueden alcanzar rápidamente sus límites de rendimiento. En vista de estas condiciones, muchos estudios médicos están confinados localmente y no pueden utilizar datos que estén disponibles en otros lugares.
Ante esta situación, una colaboración de investigación dirigida por Joachim Schultze probó un novedoso enfoque para evaluar los datos de investigación almacenados de forma descentralizada. La base para ello fue la todavía joven tecnología "Swarm Learning" desarrollada por HPE. Además de la empresa de TI, participaron en este estudio numerosas instituciones de investigación de Grecia, los Países Bajos y Alemania, incluidos los miembros de la "Iniciativa alemana COVID-19 OMICS" (DeCOI).
El aprendizaje enjambre combina un tipo especial de intercambio de información entre los distintos nodos de una red con métodos de la caja de herramientas del "aprendizaje automático", una rama de la inteligencia artificial (IA). El eje del aprendizaje automático son los algoritmos que se entrenan sobre los datos para detectar patrones en ellos, y que en consecuencia adquieren la capacidad de reconocer los patrones aprendidos también en otros datos. "El aprendizaje enjambre abre nuevas oportunidades de colaboración en la investigación médica, así como en los negocios. La clave es que todos los participantes pueden aprender de los demás sin tener que compartir datos confidenciales", afirma el Dr. Eng Lim Goh, Vicepresidente Senior y Director de Tecnología para la inteligencia artificial de HPE.
De hecho, con Swarm Learning, todos los datos de la investigación permanecen in situ. Sólo se comparten los algoritmos y los parámetros, en cierto sentido, las lecciones aprendidas. "Swarm Learning cumple los requisitos de protección de datos de forma natural", subraya Joachim Schultze.
A diferencia del "aprendizaje federado", en el que los datos también permanecen localmente, no hay un centro de mando centralizado, explicó el científico de Bonn. "El aprendizaje enjambre se produce de forma cooperativa, basándose en reglas que todos los socios han acordado de antemano. Este conjunto de reglas se plasma en una blockchain" Se trata de una especie de protocolo digital que regula el intercambio de información entre los socios de forma vinculante, documenta todos los eventos y todas las partes tienen acceso a él. "La blockchain es la columna vertebral de Swarm Learning", dijo Schultze. "Todos los miembros del enjambre tienen los mismos derechos. No hay un poder central sobre lo que ocurre y sobre los resultados. Así que, en cierto sentido, no hay una araña que controle la red de datos"
Así, los algoritmos de IA aprenden localmente, es decir, a partir de los datos disponibles en cada nodo de la red. Los resultados del aprendizaje de cada nodo se recogen como parámetros a través del blockchain y son procesados de forma inteligente por el sistema. El resultado, es decir, los parámetros optimizados, se transmite a todas las partes. Este proceso se repite varias veces, mejorando gradualmente la capacidad de los algoritmos para reconocer patrones en cada nodo de la red.
Los investigadores están aportando ahora pruebas prácticas de este enfoque mediante el análisis de imágenes de rayos X de los pulmones y de los transcriptomas: Estos últimos son datos sobre la actividad genética de las células. En el estudio actual, el objetivo era específicamente las células inmunitarias que circulan por la sangre, es decir, los glóbulos blancos. "Los datos sobre la actividad génica de las células sanguíneas son como una huella dactilar molecular. Contienen información importante sobre cómo reacciona el organismo ante una enfermedad", dijo Schultze. "Los transcriptomas están disponibles en grandes cantidades, al igual que las imágenes de rayos X, y son muy complejos. Es exactamente el tipo de información que se necesita para el análisis de la inteligencia artificial. Estos datos son perfectos para probar el Swarm Learning"
El equipo de investigación abordó un total de cuatro enfermedades infecciosas y no infecciosas: dos variantes de cáncer de sangre (leucemia mieloide aguda y leucemia linfoblástica aguda), así como la tuberculosis y el COVID-19. Los datos incluían un total de más de 16.000 transcriptomas. La red de aprendizaje de enjambre en la que se distribuyeron los datos constaba normalmente de al menos tres y hasta 32 nodos. Independientemente de los transcriptomas, los investigadores analizaron unas 100.000 imágenes de rayos X de tórax. Éstas procedían de pacientes con acumulación de líquido en el pulmón u otros hallazgos patológicos, así como de individuos sin anomalías. Estos datos se distribuyeron en tres nodos diferentes.
El análisis tanto de los transcriptomas como de las imágenes de rayos X siguió el mismo principio: En primer lugar, los investigadores alimentaron sus algoritmos con subconjuntos del conjunto de datos respectivo. Esto incluía información sobre cuáles de las muestras procedían de pacientes y cuáles de individuos sin hallazgos. El reconocimiento de patrones aprendido para "enfermo" o "sano" se utilizó entonces para clasificar otros datos, es decir, se utilizó para ordenar los datos en muestras con o sin enfermedad. La precisión, es decir, la capacidad de los algoritmos para distinguir entre individuos sanos y enfermos, se situó en torno al 90 por ciento de media en el caso de los transcriptomas (cada una de las cuatro enfermedades se evaluó por separado); en el caso de los datos de rayos X, osciló entre el 76 y el 86 por ciento.
"La metodología funcionó mejor en la leucemia. En esta enfermedad, la firma de la actividad génica es especialmente llamativa y, por tanto, más fácil de detectar para la inteligencia artificial. Las enfermedades infecciosas son más variables. No obstante, la precisión fue también muy alta en el caso de la tuberculosis y el COVID-19. En el caso de los datos de rayos X, el índice fue algo inferior, lo que se debe a la menor calidad de los datos o de las imágenes", comentó Schultze sobre los resultados. "Nuestro estudio demuestra así que el aprendizaje enjambre puede aplicarse con éxito a datos muy diferentes. En principio, esto se aplica a cualquier tipo de información para la que sea útil el reconocimiento de patrones mediante la inteligencia artificial. Ya sean datos del genoma, imágenes de rayos X, datos de imágenes cerebrales u otros datos complejos"
El estudio también descubrió que el aprendizaje en enjambre daba resultados significativamente mejores que cuando los nodos de la red aprendían por separado. "Cada nodo se beneficia de la experiencia de los demás nodos, aunque sólo se disponga de datos locales. Así pues, el concepto de aprendizaje enjambre ha superado la prueba práctica", afirma Schultze.
"Estoy convencido de que el aprendizaje enjambre puede dar un gran impulso a la investigación médica y a otras disciplinas basadas en datos". El estudio actual es sólo una prueba. En el futuro, pretendemos aplicar esta tecnología al Alzheimer y a otras enfermedades neurodegenerativas", dijo Schultze. "Swarm Learning tiene el potencial de cambiar las reglas del juego y podría ayudar a hacer más accesible la riqueza de la experiencia en medicina en todo el mundo. No sólo las instituciones de investigación, sino también los hospitales, por ejemplo, podrían unirse para formar estos enjambres y así compartir información en beneficio mutuo."