Google presenta SignGemma: inteligencia artificial que traduce el lenguaje de señas en texto en tiempo real

Google ha revelado SignGemma, un innovador modelo de inteligencia artificial (IA) diseñado para traducir el lenguaje de señas a texto hablado. Esta nueva herramienta, que forma parte de la serie Gemma, fue presentada oficialmente durante el evento Google I/O 2025 y actualmente se encuentra en fase de prueba, con un lanzamiento previsto para finales de este año.

Como modelo de código abierto, SignGemma busca mejorar la comunicación para personas con discapacidades del habla y la audición, permitiéndoles interactuar de forma más efectiva con quienes no dominan el lenguaje de señas. La iniciativa representa un paso importante hacia una tecnología más inclusiva.

Traducción en tiempo real para una comunicación más fluida

Una de las principales características de SignGemma es su capacidad para ofrecer traducción en tiempo real del lenguaje de señas al texto, lo que facilita la comunicación cara a cara. Durante la presentación, Gus Martin, gerente de producto de Gemma en DeepMind, destacó el potencial del modelo gracias a su entrenamiento con diversos conjuntos de datos que representan distintos estilos de lenguaje de señas.

El enfoque principal ha sido el lenguaje de señas americano (ASL), con el objetivo de traducirlo al inglés de manera precisa. Esto lo convierte en una herramienta especialmente valiosa para personas que dependen de este sistema para comunicarse.

En una publicación reciente en X (antes Twitter), Google DeepMind mostró una demostración de SignGemma, resaltando su impacto potencial en el desarrollo de tecnologías inclusivas. Además, la empresa animó a los primeros usuarios a brindar retroalimentación sobre el modelo.

Tecnología accesible sin conexión a internet

Una ventaja destacada de SignGemma es que puede funcionar sin conexión a internet, lo cual es crucial en zonas con conectividad limitada. Esta funcionalidad mejora su accesibilidad, permitiendo que más personas puedan beneficiarse de su uso, sin importar su ubicación geográfica.

Desde el punto de vista técnico, SignGemma se basa en el marco Gemini Nano y utiliza un vision transformer que analiza con precisión los movimientos de las manos, sus formas y las expresiones faciales. Este enfoque permite que el modelo interprete eficazmente el lenguaje de señas y proporcione traducciones en tiempo real.

Un modelo abierto para la comunidad desarrolladora

Google ha dejado claro su compromiso con la inclusión al hacer que SignGemma sea de código abierto, lo que permite a los desarrolladores integrar esta tecnología en sus propias aplicaciones y herramientas. Además, se espera que en el futuro pueda incorporarse a otras plataformas de IA existentes, como Gemini Live.

Durante esta fase temprana, Google invita a usuarios y comunidades interesadas a participar en el proceso de mejora del modelo. Para ello, ha publicado un formulario de interés donde los participantes pueden registrarse, probar la herramienta y compartir sus experiencias.

Una herramienta con gran potencial para transformar la comunicación

La llegada de SignGemma representa un avance importante en el campo de la tecnología asistiva. Al reducir la barrera entre personas usuarias del lenguaje de señas y aquellas que no lo comprenden, este modelo de IA tiene el potencial de transformar la manera en que nos comunicamos y mejorar la calidad de vida de miles de personas.

Con cada prueba y cada comentario recibido, SignGemma continúa su camino hacia convertirse en una herramienta indispensable para una comunicación más inclusiva, accesible y humana.

¿Te gustaría participar en las pruebas de SignGemma?
Google ha habilitado un formulario de interés para quienes deseen probar esta tecnología y contribuir a su desarrollo. La inclusión empieza por la colaboración.

Google presenta SignGemma: inteligencia artificial que traduce el lenguaje de señas en texto en tiempo real

Traducción en tiempo real para una comunicación más fluida

Tecnología accesible sin conexión a internet

Un modelo abierto para la comunidad desarrolladora

Una herramienta con gran potencial para transformar la comunicación

Related posts:

Xania Monet: la voz de la inteligencia artificial que conquista las listas musicales

Samsung desafía la lógica de los grandes modelos de IA con su Tiny Recursive Model (TRM)

Google integra edición de imágenes con IA en Gemini gracias a DeepMind