Google

Google utiliza nuevas tecnologías para mejorar la dicción de Google Assistant

Lograr un asistente inteligente perfecto será la tarea de muchos ingenieros de toda gama y color durante una buena porción de nuestro futuro inmediato. En esta oportunidad, el departamento de inteligencia artificial de Google, Deepmind, consiguió cambiar la forma en que Google Assistant se sirve de su voz para conseguir que sea más fluido y más natural.

¿Cómo? Actualmente, la mayoría de los asistentes inteligentes consiguen su voz por medio de una técnica, de otra o de la combinación de estas dos: una base de datos de distintas palabras grabadas por un/a actor/actriz (Concatenative TTS) o una voz computarizada que puede generar palabras a partir de la combinación de 16 mil ondas sonoras únicas por segundo (Parametris TTS). Deepmind consiguió, tras 12 meses de investigación y entrenamiento, crear una nueva forma de concebir la voz de los asistentes inteligentes.

WaveNet es un programa que utiliza una enorme base de datos de voces grabadas y se ha entrenado durante 12 meses para reconocer qué tonos siguen a cuáles otros en la producción del habla y cuáles ondas sonoras son más realistas que otras. Este impresionante logro tendrá una incidencia inmediata en el asistente inteligente de Google, Google Assistant, que podrá comunicarse con sus usuarios de forma más fluida y orgánica que antes.

Para algunos/as esto es tan solo un avance intrascendente que mejorará marginalmente la calidad de la experiencia de los usuarios para con Google Assistant, pero en realidad significa un cambio de paradigma con el potencial de revolucionar la capacidad de las computadoras para hablar las distintas lenguas del globo.

Actualmente, WaveNet solo trabaja con inglés y japonés como lenguas y ha logrado resultados impresionantes en 12 meses de aprendizaje. Es posible que otro año de entrenamiento resulte en nuevas lenguas aprendidas y una aún más pronta e impresionante consecuencia en Google Assistant.

Etiquetas: ,