La inteligencia artificial (IA) está transformando el sector salud a pasos acelerados, mejorando la gestión de flujos de trabajo, la comunicación con pacientes y el soporte en diagnóstico y tratamiento. En este contexto, Google ha lanzado una serie de modelos abiertos llamados Health AI Developer Foundations (HAI-DEF), diseñados para ofrecer a los desarrolladores herramientas potentes, eficientes y respetuosas de la privacidad.
¿Qué es HAI-DEF?
HAI-DEF es una colección de modelos abiertos, ligeros y altamente personalizables, pensados como punto de partida para proyectos de investigación y desarrollo en salud. Al ser modelos abiertos, los desarrolladores pueden adaptarlos, alojarlos localmente o en la nube, y garantizar el cumplimiento de requisitos específicos de privacidad.
En mayo, se expandió esta colección con MedGemma, una serie de modelos generativos basados en Gemma 3, desarrollados para acelerar el desarrollo de IA en ciencias de la vida. Hoy se suman dos modelos nuevos: MedGemma 27B Multimodal y MedSigLIP.
MedGemma: Inteligencia generativa multimodal para salud
MedGemma es una colección de modelos en versiones de 4B y 27B parámetros, capaces de recibir imágenes y textos médicos como entrada y generar texto como salida. Son especialmente útiles en tareas como redacción de informes médicos o preguntas visuales.
MedGemma 4B Multimodal:
- Anota un 64.4% en el benchmark MedQA, situándose entre los mejores modelos abiertos pequeños (<8B).
- En estudios con radiólogos certificados en EE.UU., el 81% de los informes de rayos X generados por MedGemma 4B fueron considerados suficientemente precisos para tomar decisiones clínicas similares a las de los informes humanos.
MedGemma 27B Text y Multimodal:
- La versión de texto anota 87.7% en MedQA, quedando a solo 3 puntos de modelos líderes como DeepSeek R1, pero a una décima parte del costo de inferencia.
- Los modelos 27B destacan en la interpretación de historias clínicas electrónicas longitudinales y en recuperación de información médica.
MedSigLIP: Codificador visual especializado
MedSigLIP es un modelo ligero de 400 millones de parámetros, basado en la arquitectura SigLIP (Sigmoid Loss for Language-Image Pretraining), ajustado con datos médicos como rayos X, imágenes dermatológicas e histopatológicas.
Sus usos principales son:
- Clasificación de imágenes médicas.
- Clasificación zero-shot (sin ejemplos específicos).
- Recuperación semántica de imágenes en bases de datos médicas.
A pesar de estar optimizado para imágenes médicas, MedSigLIP mantiene un rendimiento competitivo en imágenes naturales, lo que lo convierte en una herramienta versátil para distintas aplicaciones.
Ventajas de los modelos abiertos para salud
- Privacidad y flexibilidad: Al poder ejecutar los modelos en hardware propio, se eliminan preocupaciones sobre el uso de APIs externas.
- Personalización: Los desarrolladores pueden ajustar y afinar los modelos según sus datos y necesidades clínicas.
- Estabilidad: Al ser distribuidos como snapshots, los modelos mantienen su rendimiento constante, crucial en entornos médicos donde la reproducibilidad es clave.
Los modelos MedGemma y MedSigLIP están disponibles en formato safetensors en Hugging Face, listos para usar o adaptar.
Casos de uso en el mundo real
- DeepHealth (Massachusetts, EE.UU.): Utiliza MedSigLIP para mejorar la detección de nódulos en rayos X.
- Chang Gung Memorial Hospital (Taiwán): Ha validado el buen desempeño de MedGemma con textos médicos en chino tradicional.
- Tap Health (India): Usa MedGemma para tareas sensibles como resúmenes clínicos y recomendaciones alineadas a guías médicas.
Recursos para desarrolladores
Google ofrece notebooks detallados en GitHub para ejecutar y afinar estos modelos, además de ejemplos de implementación en Vertex AI. Una demo destacada muestra cómo usar MedGemma para recolectar información previa a una consulta médica.
Consideraciones éticas y técnicas
Los modelos fueron entrenados con datos públicos y privados rigurosamente desidentificados. Sin embargo, no deben ser usados directamente en la práctica clínica sin validación adicional. Los resultados generados deben ser verificados, correlacionados clínicamente y adaptados al contexto específico.
MedGemma y MedSigLIP representan un gran avance en el desarrollo de inteligencia artificial abierta para el sector salud. Ofrecen a investigadores y desarrolladores herramientas robustas, versátiles y responsables, capaces de impulsar nuevas soluciones médicas con un enfoque centrado en la privacidad, la adaptabilidad y la eficiencia.
Para más información y acceso a los modelos, visita el sitio de Health AI Developer Foundations (HAI-DEF) o explora la colección en Hugging Face.