¿Qué examen médico aprobó ChatGPT?

El tema que recientemente ha arrasado en Internet no es otro que ChatGPT, el chatbot de IA que debutó en noviembre pasado. La gente ha entablado conversaciones divertidas y alegres con él para probar su destreza conversadora. No solo eso, ChatGPT ha logrado numerosos logros, como aprobar algunos de los exámenes más difíciles, como el examen de licencia médica de EE. UU., un examen de la Wharton Business School y cuatro exámenes de derecho constitucional de la Facultad de Derecho de la Universidad de Minnesota. Esta hazaña ha llamado la atención del director ejecutivo de Twitter, Elon Musk, quien investigó el chatbot de IA y dijo: «Estoy seguro de que todo estará bien». Echemos un vistazo a ¿Qué examen médico aprobó ChatGPT?

Auge de ChatGPT

Es interesante observar que Open AI, la empresa de investigación en la que invirtieron Musk y Microsoft, creó ChatGPT. Cualquiera que utilice el sitio web de la herramienta de IA puede hacerle una pregunta sobre cualquier tema y recibir una respuesta rápida y detallada en forma de párrafo. ChatGPT ha demostrado su capacidad en varios dominios. Puede escribir ensayos instantáneos y complejos, redactar propuestas de marketing, producir poemas y chistes, e incluso redactar un discurso para un congresista de Estados Unidos. Sin embargo, se teme que la IA pueda hacerse cargo de algunos trabajos humanos.

Lea también: ¿ChatGPT 4 es de uso gratuito?

ChatGPT realiza un examen médico: descripción general

Uno de los últimos logros de esta herramienta es su capacidad para aprobar los exámenes de licencia médica de EE. UU. En un estudio previo a la impresión, los investigadores exploraron los límites superiores de las capacidades de ChatGPT. Introducieron preguntas de exámenes anteriores en la herramienta de inteligencia artificial y obtuvieron las respuestas, que iban desde respuestas escritas abiertas hasta opciones de opción múltiple, calificadas de forma independiente por dos médicos jueces. Se aseguraron de que las respuestas a esas preguntas no estuvieran ya en el conjunto de datos al que podía acceder el chatbot cuando fue entrenado. El equipo notó que, aunque ChatGPT no había visto las respuestas antes, se desempeñó en el umbral de aprobación o cerca de él para los exámenes sin ningún entrenamiento o refuerzo especializado. La herramienta recibió más del 50 por ciento en todos los exámenes y se acercó al umbral de aprobación del USMLE de aproximadamente el 60 por ciento. «Por lo tanto, ChatGPT ahora se encuentra cómodamente dentro del rango de aprobación», concluyó el documento.

ChatGPT aprueba el examen USMLE: todo lo que necesita saber

En un nuevo estudio innovador, científicos del Hospital General de Massachusetts (MGH) y AnsibleHealth descubrieron que ChatGPT de OpenAI puede aprobar el examen de licencia médica de los Estados Unidos (USMLE) con una impresionante tasa de precisión del 60%. Esta investigación abre posibilidades interesantes para el papel de la IA en la educación y formación médica.

Herramientas de procesamiento del lenguaje natural y educación médica

ChatGPT es una herramienta de procesamiento del lenguaje natural que se entrena con grandes cantidades de datos lingüísticos y busca patrones y relaciones. Su capacidad para generar texto nuevo según el idioma en el que está entrenado lo convierte en un candidato ideal para su uso en la educación médica. Sin embargo, la dependencia de ChatGPT de los datos de entrenamiento significa que no rastrea la web como otros chatbots de IA.

Probando el modelo

Los científicos evaluaron el modelo ChatGPT basándose en las tres pruebas estandarizadas que componen el USMLE. El equipo entrenó el modelo utilizando preguntas del examen de muestra de junio de 2022 publicado al público. Las preguntas que requirieron análisis visual fueron excluidas del conjunto de capacitación.

Para reducir el sesgo de retención de memoria, el equipo ingresó tres tipos diferentes de preguntas en el modelo:

  1. Respuesta única de opción múltiple sin justificación forzada, por ejemplo, «¿Cuál de los siguientes patógenos causa principalmente la condición del paciente?»
  2. Respuesta única de opción múltiple con justificación forzada, por ejemplo: “¿Cuál de las siguientes es la razón más probable de los síntomas nocturnos del paciente? Explique su justificación para cada elección”.
  3. Preguntas abiertas, por ejemplo: «¿Cuál sería el diagnóstico del paciente según la información proporcionada?»

Resultados impresionantes

Por primera vez, el modelo de IA pasó el USMLE con una precisión del 60% o cerca de ella sin la ayuda de formadores médicos. Este resultado es significativo y abre nuevas posibilidades para la IA en la educación médica. Los investigadores también descubrieron que los resultados de ChatGPT mostraban conocimientos y fundamentos clínicos válidos, lo que infundía más confianza en la explicabilidad y la confianza del modelo.

ChatBot de IA – Desarrollado por ChatGPT

Adéntrate en el futuro de la comunicación interactiva con ChatGPT.
Descarga la aplicación ahora.

El futuro de la educación médica

El equipo cree que ChatGPT y otros modelos conversacionales generativos pueden ayudar en la formación de futuros médicos. Una de esas aplicaciones podría ser traducir resultados médicos técnicos a un lenguaje más comprensible para los pacientes. AnsibleHealth ya está llevando a cabo este proyecto.

ChatGPT muestra su capacidad en el campo médico

Además de su capacidad para responder preguntas y diagnosticar enfermedades, GPT-4 también es un excelente traductor. Puede traducir la información de alta de un paciente que habla portugués y destilar la jerga técnica en algo que los estudiantes de sexto grado puedan leer fácilmente. GPT-4 también puede brindar a los médicos sugerencias útiles sobre los modales junto a los pacientes, ofreciendo consejos sobre cómo hablar con los pacientes sobre sus afecciones en un lenguaje claro y compasivo.

A pesar de sus limitaciones, GPT-4 puede imitar la forma en que los médicos diagnostican enfermedades con resultados sorprendentes, aunque imperfectos. Cuando se le preguntó si realmente podía participar en un razonamiento causal, respondió que su inteligencia todavía está «limitada a patrones en los datos y no implica una verdadera comprensión o intencionalidad».

Los pensamientos del Dr. Isaac Kohane sobre GPT-4

En un libro de próxima publicación titulado “La revolución de la IA en medicina”, el científico informático y médico Dr. Isaac Kohane, junto con dos colegas, probaron GPT-4, el modelo de inteligencia artificial más nuevo de OpenAI, para ver cómo funcionaba en un entorno médico. Los resultados fueron impresionantes.

En el libro, el Dr. Kohane señala que GPT-4, que se lanzó en marzo de 2023 para suscriptores de pago, puede responder correctamente a las preguntas sobre licencias de exámenes médicos de EE. UU. más del 90% de las veces. Es mucho mejor examinador que los modelos anteriores de ChatGPT AI, GPT-3 y -3.5, y también mejor que algunos médicos autorizados. Según Carey Goldberg y el vicepresidente de investigación de Microsoft, Peter Lee, GPT-4 tiene mejor criterio clínico que «muchos médicos» y puede diagnosticar enfermedades raras «tal como lo haría yo».

Prueba de GPT-4: el método

Para probar GPT-4, el Dr. Kohane y sus colegas se unieron para ver cómo funcionaba el modelo de IA en un entorno médico. Hicieron preguntas al GPT-4 y le dieron escenarios clínicos para diagnosticar, que luego se compararon con los diagnósticos realizados por médicos humanos. Los autores señalan que GPT-4 tiene varias ventajas sobre los médicos humanos, como la capacidad de recordar y sintetizar grandes cantidades de información de múltiples fuentes.

Sin embargo, los autores también reconocen que GPT-4 tiene varias limitaciones. Por ejemplo, GPT-4 no puede tener en cuenta el historial médico único de un paciente ni los determinantes sociales de la salud. Además, la dependencia de GPT-4 de grandes cantidades de datos genera preocupaciones sobre la privacidad y el sesgo de los datos.

GPT-4: capacidades y potencial

GPT-4 es más que un simple buscador de hechos y un buen examinador; También es un excelente traductor. Según los autores, GPT-4 puede traducir la información de alta de un paciente que habla portugués y destilar la jerga técnica en algo que los niños de sexto grado puedan entender fácilmente.

Pero no es sólo en el ámbito del diagnóstico donde GPT-4 se muestra prometedor. En el libro, los autores explican cómo GPT-4 puede brindar a los médicos sugerencias útiles sobre el trato con los pacientes y ofrecer consejos sobre cómo conectarse mejor con los pacientes.

Sin embargo, es importante señalar que GPT-4 no es infalible. Como advierten los autores, aún puede cometer errores y no ha prestado el juramento hipocrático. Además, la tecnología de inteligencia artificial, incluida GPT-4, plantea cuestiones éticas sobre el desplazamiento laboral y la privacidad de los pacientes.

Conclusión: el futuro de la IA en la medicina

A pesar de estas limitaciones, el éxito de GPT-4 en el diagnóstico de afecciones médicas plantea posibilidades interesantes para la tecnología de inteligencia artificial en medicina. En el futuro, modelos de IA como GPT-4 podrían ayudar a los médicos a diagnosticar enfermedades raras, traducir la jerga médica y brindar una mejor atención a los pacientes. Sin embargo, es importante que los modelos de IA se desarrollen y prueben teniendo en cuenta consideraciones éticas.

Deja un comentario