Mejora la accesibilidad de tus videos con descripciones de audio automáticas usando Amazon Nova

Elena Digital López

Más de 2.2 mil millones de personas en todo el mundo sufren algún tipo de discapacidad visual, según datos de la Organización Mundial de la Salud. Este panorama ha impulsado un creciente interés en la accesibilidad de los medios visuales, como la televisión y el cine, áreas donde se ha vuelto obligatorio ofrecer descripciones de audio para aquellos con discapacidades visuales. Esta medida busca cumplir con normativas como la Ley de Estadounidenses con Discapacidades (ADA).

Tradicionalmente, la producción y distribución de contenido audiovisual accesible requieren significativos recursos, incluyendo creadores de contenido, narradores y personal técnico especializado. Este proceso tradicionalmente puede ser costoso, alcanzando hasta 25 dólares por minuto cuando se subcontrata a terceros. No obstante, la incorporación de modelos de inteligencia artificial generativa, como los recientemente anunciados por Amazon Nova, promete simplificar y economizar parcialmente este proceso.

La nueva familia de modelos Amazon Nova, disponible a través de Amazon Bedrock, incluye tres versiones: Amazon Nova Lite, Amazon Nova Pro y Amazon Nova Premier. Estos modelos multimodales están diseñados para transformar el análisis de contenido audiovisual en descripciones accesibles de manera eficiente. Además de reducir los costos, ofrecen una solución más rápida para generar este contenido, crucial para cumplir con los estándares de accesibilidad exigidos por las regulaciones.

El método propuesto contempla el uso de varios servicios de Amazon, como Amazon Rekognition, que segmenta videos identificando cambios visuales, y Amazon Polly, que convierte descripciones de texto en audio. A través de una serie de pasos, se puede automatizar la creación de un flujo de trabajo que permite a las empresas de medios brindar contenido accesible. Aunque no es una solución completamente lista para su implementación, ofrece un marco adaptable que los interesados pueden personalizar según sus necesidades.

La introducción de una solución automatizada para generar descripciones de audio podría transformar cómo las empresas abordan la accesibilidad de su contenido. A medida que aumenta el interés por cumplir con las normativas de accesibilidad, el uso de tecnologías de inteligencia artificial, como las ofrecidas por Amazon, se muestra como un recurso valioso para mejorar la inclusión de las personas con discapacidades visuales.