No todos los pacientes están expuestos a la IA médica: el riesgo es desigual

Mundiario 25 Jun, 2026 06:08

No todos los pacientes están expuestos a la IA médica: el riesgo es desigual

La expansión de la inteligencia artificial en medicina está transformando la forma en la que se diagnostica, se registra y se analiza la salud de millones de pacientes. Sin embargo, bajo esa promesa de eficiencia y precisión se está consolidando una vulnerabilidad silenciosa: la posibilidad de que sistemas entrenados con datos clínicos revelen información privada sin necesidad de hackeos ni accesos ilegales. Un nuevo estudio publicado en la revista científica Nature advierte de que este riesgo no es homogéneo, sino profundamente desigual.

La investigación pone el foco en algo que hasta ahora había pasado relativamente desapercibido: la exposición diferencial de los pacientes según su perfil. Mientras que los historiales de la mayoría de la población tienden a diluirse en el enorme volumen de datos con los que se entrenan los modelos, ciertos grupos quedan mucho más expuestos a ser identificados. Minorías raciales, personas con enfermedades raras, perfiles no binarios o individuos en situación socioeconómica vulnerable emergen con mayor claridad en las respuestas de los sistemas de IA.

El estudio demuestra que esta asimetría no es teórica. A través de simulaciones con bases de datos clínicas reales, los investigadores comprobaron que es posible inferir si una persona concreta ha sido utilizada en el entrenamiento de un modelo sin acceder directamente a la base de datos. No hace falta vulnerar sistemas ni romper barreras de seguridad: basta con interrogar a la IA de forma estratégica y analizar sus respuestas.

Este tipo de técnicas, conocidas como ataques de inferencia de pertenencia, dibujan un escenario inquietante. La inteligencia artificial, diseñada para aprender patrones generales, puede acabar delatando su propio “recuerdo” de casos concretos. Y cuando ese recuerdo coincide con información médica sensible —como un diagnóstico de cáncer, una condición genética o un historial psiquiátrico— el impacto sobre la privacidad puede ser devastador.

La investigación llega en un momento clave. La inteligencia artificial ya no es una promesa futura en la sanidad, sino una herramienta cotidiana. Su uso se extiende desde la transcripción de consultas hasta el análisis automatizado de pruebas de imagen. En paralelo, la apuesta institucional por los datos sanitarios masivos crece en Europa, lo que aumenta tanto el potencial como los riesgos.

Una brecha de privacidad que no afecta a todos por igual

Uno de los hallazgos más inquietantes del estudio es que el riesgo de filtración no se distribuye de forma uniforme. Cuanto más “atípico” es un perfil dentro de la base de datos, más fácil resulta inferir su presencia en el entrenamiento. Esto convierte a las minorías en objetivos involuntarios de una exposición desproporcionada.

En palabras de Moritz Knolle, autor principal del trabajo, estos ataques pueden ejecutarse con recursos técnicos relativamente bajos, lo que los hace potencialmente realistas en entornos no controlados. La clave está en que los modelos de lenguaje tienden a ser más precisos o “elocuentes” cuando reconocen patrones ya vistos durante su entrenamiento, lo que abre la puerta a deducciones indirectas.

Cómo se producen los ataques sin romper la seguridad

A diferencia de un ciberataque convencional, los ataques de inferencia no requieren acceso a los servidores ni a las bases de datos médicas. Funcionan mediante consultas repetidas a la IA, observando cómo varían sus respuestas ante preguntas específicas.

Si un modelo ha sido entrenado con datos de un paciente concreto, puede mostrar respuestas ligeramente más consistentes, detalladas o seguras cuando se le interroga sobre escenarios similares. Esa diferencia, aunque sutil, es suficiente para reconstruir probabilidades de pertenencia.

Este mecanismo es especialmente relevante en sistemas conversacionales avanzados, donde la interacción es fluida y permite múltiples iteraciones de preguntas. Cuanto más sofisticado es el modelo, más información indirecta puede ofrecer sin ser consciente de ello.

Minorías en el centro del riesgo

El estudio subraya un punto crítico: los datos de las personas “promedio” tienden a desaparecer estadísticamente en el ruido de los grandes conjuntos de entrenamiento. Sin embargo, los casos menos frecuentes destacan con mayor nitidez. Esto implica que las minorías —ya sean por condición médica, identidad o situación social— quedan más expuestas a la reidentificación.

Este fenómeno introduce una paradoja incómoda: la misma diversidad que mejora la capacidad diagnóstica de la IA es la que incrementa el riesgo de exposición para ciertos individuos. La tecnología que busca generalizar el conocimiento puede acabar individualizando precisamente a quienes deberían permanecer más protegidos.

El dilema europeo de los datos sanitarios

El debate no es solo técnico, sino también político. La Comisión Europea impulsa un marco de uso secundario de datos de salud que pretende acelerar la innovación médica. Pero esa apertura masiva de información plantea interrogantes sobre los límites de la privacidad.

Según David Arroyo, investigador del CSIC, el problema se intensifica especialmente en los modelos de lenguaje grandes, donde la interacción conversacional multiplica las posibilidades de extracción indirecta de información sensible.

Privacidad vs precisión: una tensión sin resolver

El estudio también analiza posibles soluciones, como la privacidad diferencial, que introduce ruido en los datos para evitar la identificación de individuos. Sin embargo, esta técnica no está exenta de compromisos: puede degradar el rendimiento de los modelos, especialmente en tareas médicas donde la precisión es crítica.

Aquí surge una tensión estructural que la investigación no resuelve del todo: mejorar la protección de los datos puede implicar reducir la eficacia diagnóstica de la IA. Y al revés, maximizar su rendimiento puede aumentar la exposición de los pacientes.

Los autores, sin embargo, no plantean un escenario de elección binaria. Insisten en que es posible avanzar hacia modelos que equilibren ambos factores, aunque reconocen que todavía queda investigación por delante.

La adopción de la inteligencia artificial en hospitales europeos ya es una realidad extendida. Su integración promete aliviar la carga asistencial, reducir tiempos de espera y mejorar la detección temprana de enfermedades. Pero este avance tecnológico arrastra una pregunta incómoda: ¿a qué precio en términos de privacidad?

El estudio publicado en Nature no cuestiona el potencial de la IA médica, sino su gobernanza. La advertencia es clara: la exposición de datos sensibles no es un riesgo abstracto ni lejano, y mucho menos uniforme. Es una vulnerabilidad activa que afecta de manera desigual a quienes ya son más vulnerables. @mundiario

Visitar fuente original completa