Un modelo de inteligencia artificial (IA) llamado Delphi-2M puede predecir la probabilidad de desarrollar más de mil enfermedades con hasta dos décadas de antelación. Este avance, publicado en la revista Nature, representa un paso significativo en la medicina preventiva y personalizada, utilizando tecnología similar a la de los grandes modelos de lenguaje como ChatGPT.
La capacidad de anticipar la aparición de enfermedades crónicas permite implementar intervenciones tempranas. Esto incluye cambios en el estilo de vida o la recomendación de pruebas diagnósticas específicas, mucho antes de que las dolencias causen un daño irreversible.
Puntos Clave
- Delphi-2M predice más de 1.000 enfermedades con hasta 20 años de antelación.
- El modelo se entrenó con datos de 400.000 personas del Reino Unido y se validó con casi dos millones de pacientes en Dinamarca.
- Ofrece probabilidades de riesgo, no certezas, con mayor fiabilidad a corto plazo.
- La precisión es comparable a los mejores modelos específicos para enfermedades como el infarto.
- Se necesitan ensayos clínicos para evaluar los beneficios y efectos emocionales en pacientes.
Avances en Predicción de Salud
Tradicionalmente, la evaluación de riesgos de salud se basaba en diagnósticos aislados. Sin embargo, los investigadores entienden que es crucial analizar la evolución completa de la salud de una persona. Esto implica comprender cómo las enfermedades previas se interrelacionan y cómo influyen en futuras afecciones.
Un equipo de investigadores del Instituto Europeo de Bioinformática, el DKFZ (Centro Alemán de Investigación del Cáncer) y varias instituciones danesas desarrolló Delphi-2M. Este modelo aplica la misma tecnología que impulsa los grandes modelos de lenguaje para aprender y proyectar la historia natural de un vasto conjunto de enfermedades.
Dato Interesante
El modelo Delphi-2M es capaz de identificar patrones de enfermedad a partir de historiales médicos, factores de estilo de vida y condiciones de salud preexistentes.
Moritz Gerstung, director de la División de Inteligencia Artificial en Oncología del DKFZ y coautor del estudio, destacó la amplitud de las predicciones del modelo.
"El hallazgo más inesperado fue que el modelo puede predecir más de 1.000 enfermedades. Habríamos esperado que funcionara con algunas, pero que fallara con muchas otras. Esto muestra lo interconectadas que están muchas enfermedades y resalta la necesidad de investigar los mecanismos subyacentes que las conectan", explicó Gerstung.
Entrenamiento y Validación del Algoritmo
El algoritmo de Delphi-2M fue entrenado con datos médicos de 400.000 personas del Biobanco del Reino Unido. Posteriormente, se validó con registros de casi dos millones de pacientes en Dinamarca. Esta amplia base de datos permite al modelo proyectar trayectorias de salud tanto a nivel poblacional como individual, con un horizonte de hasta dos décadas.
Las predicciones de Delphi-2M, al igual que las meteorológicas, no ofrecen certezas absolutas. En cambio, proporcionan probabilidades de que una persona desarrolle ciertas enfermedades en un período específico. La fiabilidad de estas predicciones es mayor a corto plazo.
Contexto de Predicción
Cuando el modelo calcula el riesgo de un infarto en los próximos 10 años, acierta aproximadamente en siete de cada 10 casos. Para un período de dos décadas, la precisión se reduce a un 14%, lo que sigue siendo superior al 12% que se obtiene solo conociendo la edad y el sexo.
Para hombres de entre 60 y 65 años en el Biobanco del Reino Unido, el riesgo anual de infarto puede variar desde 4 de cada 10.000 hasta 1 de cada 100. Esto depende de su historial médico y hábitos de vida. En las mujeres, el riesgo promedio es menor, pero la distribución de probabilidades es similar.
Una validación crucial fue comparar las predicciones del modelo con datos reales del biobanco no utilizados en el entrenamiento. Se confirmó que los riesgos calculados coincidían con la incidencia observada de casos en diferentes grupos de edad y sexo. Esto demuestra que las estimaciones de Delphi-2M reflejan fielmente las tendencias poblacionales reales.
Precisión y Utilidad Clínica
Delphi-2M ha demostrado una precisión comparable a la de los mejores modelos específicos para enfermedades como la demencia o el infarto de miocardio. Incluso supera a los algoritmos de predicción de mortalidad. La única excepción es la diabetes, donde un marcador de análisis de sangre (la hemoglobina glicosilada HbA1c) sigue siendo más fiable.
El estudio también identificó enfermedades que aumentan el riesgo de sufrir otras. Entre ellas se encuentran los trastornos mentales y algunos tumores del aparato reproductor femenino. Esta interconexión subraya la necesidad de un enfoque integral en la prevención.
Consideraciones Éticas y Futuras Aplicaciones
La posibilidad de conocer con tanta antelación las probabilidades de enfermedades plantea cuestiones éticas. Moritz Gerstung sugiere la necesidad de más estudios para determinar cómo este conocimiento puede beneficiar realmente a los pacientes.
Gerstung opina que las aplicaciones de la IA como asistente médico "deberían probarse en ensayos clínicos aleatorizados". En estos ensayos, un grupo recibiría visitas médicas con apoyo de IA y otro sin él. "Tras un período de seguimiento, se evaluará si el grupo asistido por IA obtuvo mayores beneficios en comparación con las consultas tradicionales", añadió. También considera importante incluir "evaluaciones subjetivas del bienestar de las personas para valorar los efectos emocionales de conocer o no sus riesgos".
Guillermo Lazcoz, miembro del Comité de Ética de la Investigación del Instituto de Salud Carlos III, advierte sobre los posibles riesgos de una herramienta de predicción tan potente. Estos incluyen la discriminación por parte de aseguradoras o el uso indebido de datos por entidades financieras.
Lazcoz señala que la aplicación de la IA al procesamiento de grandes bases de datos de salud "añade una capa más de riesgos a los que ya conocíamos". Esto incluye la posibilidad de que los datos acaben en manos de un banco para evaluar la solvencia crediticia de un cliente según su predisposición a ciertas enfermedades.
Protección de Datos
La IA puede identificar a una persona a partir de datos supuestamente anónimos, lo que exige nuevas medidas de protección. En Europa, se están desarrollando espacios seguros para el tratamiento de datos, donde la información no se mueve y el acceso de terceros está limitado en tiempo y propósito.
Es fundamental distinguir entre organizaciones como el Biobanco del Reino Unido, que tiene controles estrictos, y empresas como 23andMe, que han enfrentado escándalos por problemas de protección de datos. Mikel Recuero, abogado especializado en protección de datos, coincide en que, en el ámbito europeo, existen múltiples capas de control para prevenir el uso indebido de datos biomédicos.
El acceso a biobancos ya implica un filtro ético, donde los investigadores deben justificar la finalidad científica de su solicitud. "Si la información es identificable, la normativa obliga a restringir su uso a los propósitos autorizados, evitando, por ejemplo, las aplicaciones en seguros o banca", explica Recuero.
El nuevo reglamento del espacio europeo de datos de salud refuerza esta lógica. "Prohíbe expresamente decisiones comerciales —como la modificación de primas de un seguro— basadas en información genética", asegura Recuero. Aunque los riesgos nunca desaparecen del todo, "existen mecanismos sucesivos (éticos, reguladores, jurídicos) que actúan de forma preventiva, limitando las posibilidades de discriminación y obligando a acreditar un beneficio social en cada proyecto que vaya a usar estos datos", concluye.
Impacto en la Comprensión de Enfermedades
Los modelos de lenguaje como GPT-4 o Gemini aprenden secuencias de palabras. Los investigadores de Delphi-2M encontraron una analogía con la salud: el historial médico de una persona también puede verse como una secuencia de eventos temporales, incluyendo diagnósticos, factores de riesgo y hábitos de vida. Esta perspectiva permite hacer predicciones más informadas.
Aunque el modelo aún requiere mejoras para su aplicación directa en la atención a pacientes, ya es una herramienta valiosa. Ayuda a comprender mejor cómo se desarrollan y progresan las enfermedades. También permite evaluar cómo el estilo de vida y las enfermedades pasadas influyen en el riesgo de futuras afecciones.
Generación de Datos Sintéticos
Uno de los aspectos más innovadores de Delphi-2M es su capacidad para generar datos de salud sintéticos. A partir de información parcial, el modelo puede crear trayectorias completas que mantienen las propiedades estadísticas de los datos reales, pero sin corresponder a ninguna persona específica. Esto protege la privacidad de los pacientes y permite entrenar otros modelos de IA sin necesidad de acceder a datos clínicos sensibles. Por ejemplo, se podría calcular el impacto en la salud poblacional si la obesidad aumenta un 5%.
Actualmente, existen algoritmos que predicen el riesgo de algunas enfermedades específicas, como problemas cardíacos o cáncer de mama. Sin embargo, estos enfoques no capturan la complejidad de la salud humana, donde múltiples enfermedades coexisten y se condicionan mutuamente. En sociedades con poblaciones cada vez más envejecidas, será esencial la capacidad de prever la carga de numerosas enfermedades. Esto permitirá diseñar políticas e inversiones adecuadas para prevenirlas y estar preparados ante su llegada.




