La inteligencia artificial (IA) continúa transformando nuestro mundo, haciendo que la tecnología sea cada vez más accesible para todas las personas. En el marco del Día Global de Concienciación sobre la Accesibilidad, Google ha anunciado una serie de novedades en sus productos para Android y Chrome, así como nuevos recursos para desarrolladores que trabajan en herramientas de reconocimiento de voz.
Innovaciones con IA en Android para la accesibilidad visual y auditiva
Google está integrando lo mejor de su tecnología de IA, incluyendo el modelo Gemini, en experiencias móviles que están especialmente diseñadas para usuarios con discapacidades visuales y auditivas.
Gemini y TalkBack: una revolución para personas con baja visión
El año pasado, Google incorporó las capacidades de Gemini a TalkBack, el lector de pantalla de Android, para ofrecer descripciones generadas por IA de imágenes, incluso cuando no existe texto alternativo. Ahora, esta integración se amplía para que los usuarios puedan hacer preguntas y recibir respuestas sobre las imágenes que tienen en pantalla. Por ejemplo, si recibes una foto de la guitarra de un amigo, puedes no solo obtener una descripción, sino también preguntar sobre la marca, el color o cualquier otro detalle visible.
Además, esta funcionalidad permite describir y consultar sobre el contenido de toda la pantalla, ideal para cuando estás comprando en una app y quieres saber detalles como el material de una prenda o si hay algún descuento disponible.
Expresividad en tiempo real con los subtítulos
Otra novedad es Expressive Captions, que ofrece subtítulos en tiempo real para cualquier sonido en la mayoría de las aplicaciones del teléfono. Gracias a la IA, no solo captura lo que se dice, sino también cómo se dice, incluyendo la duración y el tono de las palabras. Esto ayuda a captar mejor la emoción o intención detrás de frases, como en un partido de fútbol donde un comentarista grita un “golazo” prolongado o cuando alguien dice “nooooo” en un mensaje de video.
Esta función está disponible en inglés para usuarios en EE. UU., Reino Unido, Canadá y Australia, y es compatible con dispositivos que tengan Android 15 o superior.
Mejorando el reconocimiento de voz para todo el mundo
Desde 2019, Google impulsa el Proyecto Euphonia, que busca hacer que el reconocimiento de voz sea accesible para personas con patrones de habla no estándar. Ahora, con recursos abiertos para desarrolladores, este proyecto se expande a más idiomas y culturas.
Nuevos recursos para desarrolladores
Google pone a disposición de los desarrolladores repositorios de código abierto en GitHub, permitiendo crear herramientas de audio personalizadas y entrenar modelos para diferentes patrones de habla, fomentando así un ecosistema inclusivo.
Apoyo a proyectos en África
En colaboración con Google.org, se apoya al Centre for Digital Language Inclusion (CDLI) en la University College London para mejorar el reconocimiento de voz en diez lenguas africanas. Se desarrollan modelos de reconocimiento de voz y se generan conjuntos de datos abiertos que beneficiarán a toda la comunidad de desarrolladores y organizaciones en esta región.
Más accesibilidad para estudiantes y usuarios de Chromebook
Google ha ampliado sus herramientas de accesibilidad para estudiantes con discapacidades, permitiendo desde la navegación por gestos faciales en Chromebooks hasta la personalización de la lectura. Además, los estudiantes que utilizan la aplicación Bluebook de College Board para exámenes SAT y Advanced Placement ahora pueden acceder a todas las funciones de accesibilidad integradas en Google, incluyendo lectores de pantalla y dictado por voz.
Chrome: un navegador más accesible para todos
Con más de 2 mil millones de usuarios, Google Chrome también ha mejorado en accesibilidad. Entre las novedades:
- Mejor acceso a PDFs: ahora, Chrome en escritorio reconoce automáticamente PDFs escaneados mediante OCR (Reconocimiento Óptico de Caracteres), permitiendo seleccionar, copiar, buscar texto y utilizar lectores de pantalla.
- Zoom de página personalizado en Android: permite aumentar el tamaño del texto en Chrome sin alterar el diseño de la página web, ofreciendo una mejor experiencia de lectura adaptada a las necesidades de cada usuario.
Estos avances demuestran cómo la inteligencia artificial no solo impulsa la innovación tecnológica, sino que también contribuye a un mundo más inclusivo y accesible para todas las personas, independientemente de sus capacidades.