Lo que debes de saber
- El 80% de las listas de diagnósticos posibles que genera la IA son incorrectas.
- En cáncer, un tercio de las recomendaciones de tratamiento no siguen las guías médicas.
- Los chatbots solo aciertan cuando tienen TODA la información, algo que un paciente común nunca da.
- Mientras un estudio advierte peligros, el comunicado oficial del hospital habla de ‘precisión impresionante’.

El bot que te manda a biopsiar un resfriado
La desesperación por conseguir un médico de cabecera está llevando a la gente a consultar sus síntomas con el primer «experto» disponible en internet: un chatbot de inteligencia artificial. El problema, según un estudio publicado en JAMA Network Open por investigadores de Mass General Brigham y citado por The Boston Globe, es que ese experto virtual se equivoca de manera alarmante. Cuando solo se le dan síntomas básicos —edad, género y malestar—, las 21 versiones de modelos de lenguaje grande evaluadas, incluyendo ChatGPT, Claude y Gemini, fallaron más del 80% de las veces al generar la lista correcta de diagnósticos posibles. Eso no es un error menor. Es la diferencia entre pensar que tienes migraña y en realidad estar al borde de un derrame cerebral. El doctor Marc Succi, líder del estudio, lo dijo sin rodeos: la gente puede terminar pidiendo biopsias innecesarias o retrasando tratamientos urgentes porque un algoritmo les dio un falso sentido de seguridad. La promesa de la medicina accesible se estrella contra la pared de los datos incompletos, y el paciente es quien paga los platos rotos.
Lo más interesante —y preocupante— del estudio es el giro de tuerca. Los chatbots mejoraron su precisión a más del 90% solo cuando los investigadores les dieron toda la información: no solo los síntomas, sino los resultados del examen físico y de laboratorio. Ahí está el truco de magia. El bot no es un adivino; es un procesador de datos que necesita el menú completo para acertar. El problema es que el ciudadano común que busca en ChatGPT a las 3 de la mañana no tiene acceso a sus propios análisis de sangre o a un reporte de auscultación. Juega con la mitad del tablero y, según la ciencia, pierde 8 de cada 10 veces. Esta dependencia de la información perfecta expone la fantasía de la autodiagnosis digital: asume que el paciente es su propio médico de cabecera, su propio laboratorista y su propio radiólogo, todo al mismo tiempo. Una expectativa tan absurda como peligrosa.
«You can’t just trust what the chatbot says. It’s a good start but there needs to be oversight and a human in the loop.» – Dr. Marc Succi, en entrevista para The Boston Globe.
La esquizofrenia institucional: ¿Peligro o ‘precisión impresionante’?
Aquí es donde la historia se pone buena. Mientras el estudio publicado en una revista médica de alto perfil suena las alarmas, la maquinaria de comunicación del propio sistema de salud parece cantar una canción distinta. Si buscas el comunicado oficial de Mass General Brigham, el título no habla de riesgos del 80%, sino de algo muy distinto: «ChatGPT Shows ‘Impressive’ Accuracy in Clinical Decision Making». Es el mismo centro de investigación, pero el mensaje para la prensa y el público general está empaquetado con un optimismo que los datos crudos no justifican por completo. No es mentira —la precisión final con todos los datos es alta—, pero es una narrativa selectiva. Es como si el departamento de ingeniería de un coche dijera «el freno falla en el 80% de las curvas cerradas» y el de marketing anunciara «¡tenemos un sistema de frenado de precisión impresionante en rectas!». La verdad depende de qué parte del camino estés viendo.
Esta dualidad no es casual. Refleja la tensión inherente en la adopción de cualquier tecnología disruptiva en salud: el impulso por innovar y posicionarse como líder choca con la obligación ética de prevenir daños. Un blog interno del Brigham, Brigham Health on a Mission, aborda un ángulo aún más delicado: las recomendaciones de tratamiento para cáncer. Un estudio de 2023 encontró que ChatGPT daba recomendaciones inapropiadas en un tercio de los casos al no alinearse con las guías clínicas nacionales. La Dra. Danielle Bitterman, oncóloga e investigadora, hizo una observación clave: la IA condensa la información en una respuesta «bonita y resumida», pero el usuario no puede discernir la calidad de las fuentes detrás de esa respuesta. El peligro no es solo la equivocación, sino la autoridad con la que se viste el error. Google te da una lista de enlaces y tú juzgas; ChatGPT te da un veredicto y tú tiendes a creer.
El contexto que nadie quiere mencionar: la crisis de acceso
Toda esta discusión técnica pierde el punto si ignoramos el elefante en la habitación: la gente recurre a los bots porque el sistema de salud les falló primero. The Boston Globe lo menciona de pasada: para muchos es «casi imposible» conseguir una cita con un médico primario cuando se sienten enfermos. La IA no está compitiendo con médicos perfectos y accesibles; está llenando un vacío desesperado creado por sistemas saturados, costos prohibitivos y tiempos de espera eternos. Criticar el uso de ChatGPT para diagnósticos sin reconocer esta realidad es como regañar a alguien por beber agua sucia cuando le cortaron el suministro. El verdadero problema de fondo no es la curiosidad digital del paciente, sino la inaccesibilidad crónica de la atención médica básica. La tecnología llegó a tapar un hoyo que la sociedad llevaba décadas ignorando.
El caso de The New York Times es sintomático de esta barrera de acceso. Al intentar consultar su artículo sobre el tema, el medio devolvió un error de acceso prohibido, un recordatorio físico de que incluso la información de calidad sobre salud a menudo está tras muros de pago o restricciones geográficas. Mientras, la IA es gratuita, inmediata y siempre disponible. No es de extrañar su popularidad. La advertencia de Harvard Medical School sobre «informes aleccionadores» llega a un público que ya tomó una decisión pragmática frente a la falta de opciones. El mensaje «consulta a un profesional» suena hueco cuando ese profesional está a seis meses de distancia o cuesta el salario de una semana.
¿Y ahora qué, doctor Google?
El futuro no es desechar la IA, sino entender su lugar. El estudio de Mass General Brigham deja claro que su valor potencial está en asistir a los profesionales, no en reemplazarlos. Un médico humano puede usar el bot para revisar literatura, generar recordatorios o explorar diagnósticos raros, siempre con un filtro crítico y la última palabra. El modelo peligroso es el que salta del síntoma a la recomendación sin un humano en el ciclo. La regulación y la alfabetización digital son urgentes. Las plataformas de IA deberían tener advertencias médicas explícitas, y los sistemas de salud deberían crear canales accesibles para que la gente valide la información obtenida en línea. Pero eso requiere inversión y voluntad política, dos recursos más escasos que una cita con el médico. Mientras tanto, millones seguirán jugando a la ruleta rusa diagnóstica con un algoritmo que, con datos perfectos, es brillante, pero con los datos de la vida real, es un peligro latente. La medicina del futuro llegó, pero trajo consigo los mismos viejos problemas de siempre: desesperación, desinformación y la brecha entre lo que la tecnología puede hacer y lo que la gente realmente necesita.


