EMOLTV

Inteligencia artificial permitirá crear una "voz sintética" personalizada para las personas que tengan riesgo de perderla

El sistema permite almacenar horas de lectura para luego generar un sonido que parezca más natural y dejar atrás los sistemas de voz robóticos que se utilizan hasta ahora.

11 de Noviembre de 2019 | 12:37 | Redactado por Camila Díaz S., Emol/DPA
imagen
El Mercurio (Archivo/Imagen referencial)
.Las personas que estén en riesgo de perder su voz por intervenciones médicas o diagnósticos clínicos podrán continuar utilizando un software que, gracias a la inteligencia artificial, podrá crear una voz a partir de registros anteriores del mismo paciente y así "naturalizar" el sonido.

Se trata de un proyecto liderado por la Universidad de Northeastern de Boston, en Estados Unidos, que ha abierto un centro en colaboración con el proyecto VocaliD para que las personas puedan registrar su voz en este sistema basado en inteligencia artificial.

El centro, llamado "Clínica de Preservación de la Voz", nace en colaboración y a partir del proyecto VocaliD de la investigadora de la misma casa de estudios, Rupal Patel. VocaliD es un proyecto que pretende crear un banco de voces que sean almacenadas por todas aquellas personas que lo deseen y que estén en riesgo de perder la voz, para que en un futuro puedan continuar comunicándose con los demás a través de su propia voz en versión sintetizada.

"A veces vienen a nosotros en el último momento", explica Patel en referencia al motivo de la creación de la clínica. "No tienen tiempo suficiente para almacenar su voz y están también tan envueltos en su enfermedad y luego en la operación. Es muy estresante". Hasta ahora, el sistema sólo permitía que los usuarios grabaran sus voces desde sus casas.

Sin embargo, a partir de ahora, los profesionales del centro orientarán y asistirán a los usuarios a la hora de llevar a cabo todo el proceso "para asegurarnos de que tus grabaciones son de buena calidad y utilizables para la generación de voz sintética", aseguran.

El proceso se basa en un sistema de inteligencia artificial, en el uso de algoritmos de aprendizaje automático, que se inicia con la grabación por parte del usuario de su voz en el portal del "Banco de voces humanas de VocaliD", "VocaliD Human Voicebank" en inglés, a través de la lectura de historias cortas o cualquier otro tipo de contenido de su interés, según señala la página oficial del centro.

El proceso de grabación requiere de una duración de "al menos 40 minutos", según apuntan desde la universidad, "para crear una voz de calidad razonable". De todas formas, apostillan que "por supuesto cuantos más discursos y mejor calidad de las grabaciones, mejor la calidad y la naturalidad de la voz digital".

Es por ello que el centro recomienda grabar alrededor de 1.500 frases a lo largo de varias sesiones para "asegurarnos que tienes suficiente audio de alta calidad para la construcción de la voz". Además, las grabaciones deben dividirse en sesiones de entre 15 y 20 minutos, aconsejan desde la clínica, "para optimizar la calidad y minimizar la fatiga".

Una vez realizadas las grabaciones, estos registros se almacenan en un formato anónimo y están disponibles para el uso del usuario, o incluso también para crear voces personalizadas mixtas para todos aquellos que no han tenido la oportunidad de grabar su propia voz antes de perderla y que quieran crear una voz sintetizada, a su medida que se asemeje lo máximo posible a la suya personal.
EL COMENTARISTA OPINA
¿Cómo puedo ser parte del Comentarista Opina?