Te das cuenta de lo ilusorio que parece cuando la gente en las películas habla con los robots como si fueran humanos. Aunque no de la misma manera, pero Google casi está ahí para hacerte chatear con un robot, aunque no uno en caja de hojalata. Google, recientemente en su conferencia anual de desarrolladores de E/S, ha anunciado esta revolucionaria tecnología de inteligencia artificial llamada ‘Duplex’. El momento se volvió glorioso cuando el director ejecutivo, Sundar Pichai, presentó Duplex a la multitud que luego respondió con una ronda de aplausos. La audiencia también compartió risas cuando la voz humana generada por computadora usó términos como ‘mm… hmm’ y ‘ahhh’ (a diferencia del Asistente de Google), haciendo que la conversación fuera impecable y más humana.

Lea también: 9 cosas que no sabías que el Asistente de Google puede hacer
Con el lanzamiento de Google Duplex parece cumplirse el ansiado objetivo de interactuar con las máquinas como una conversación natural. Sin embargo, ha habido logros notables en la capacidad de la computadora para comprender y responder a una voz humana con la implementación de redes neuronales profundas como la búsqueda por voz de Google y WaveNet. Pero aún falta cuando tienes que interactuar con máquinas en una voz computarizada predefinida que no entiende el lenguaje natural. Puede experimentar la lucha cuando tiene que hablar muy lento y claro para que la máquina entienda y responda.
¿En qué se diferencia Google Duplex del Asistente de Google?
Voz como humana.
Una de las diferencias más significativas entre Google Duplex y Assistant es la forma en que responde a tu comando. Donde Duplex está diseñado de tal manera que suena natural, Google Assistant, a pesar de su valor, suena como una máquina y computarizado. Google Duplex mejora su experiencia conversacional con computadoras con una voz familiar y comprensible. Especialmente, el uso de términos como ‘hmm’ y ‘ahh’ hace que sea difícil señalar como una voz emitida por una máquina.
Capacidad para hablar sobre las llamadas en su nombre.
Otra gran diferencia entre las dos tecnologías es que Duplex puede hacer llamadas y hablar en su nombre para cumplir con un comando de usuario. Mientras que el Asistente solo puede ayudar con la información disponible en Internet o simplemente hacer una llamada. Por ejemplo, si desea reservar una mesa para dos en un restaurante que no admite reservas en línea, es posible que el Asistente de Google no pueda ejecutar la tarea. Sin embargo, Google Duplex podría obtener el no. desde Internet y hacer una llamada. Le hablaría a la persona del otro lado de la manera más humana que nadie pueda diferenciar y tendrá su mesa reservada sin que usted esté en la llamada. ¿No es la perfección en el siguiente nivel?
Lea también: ¡Saluda a la aplicación Google News!
Uso de Red Neuronal Recurrente (RNN) y Reconocimiento Automático de Voz (ASR).
El éxito del sonido natural de Google Duplex radica en los avances en sus cuatro pilares, es decir, comprensión, interacción, habla y sincronización. La red neuronal recurrente es el núcleo para manejar estos cambios, que se desarrolla utilizando TFX (TensorFlow Extended). Para que llegara al éxito, la RNN de Duplex fue entrenada en una masa de datos de conversaciones telefónicas anonimizadas. Esta red también utiliza la salida ASR, características del audio, parámetros de llamadas e historial de conversaciones y mucho más. Para mejorar el modelo, Google Duplex utilizó la optimización de hiperparámetros de TFX.

En general, Google Duplex es una de las mejores formas de inteligencia artificial que domina al Asistente de Google. Según Google, Duplex ejecuta las tareas de forma autónoma y sin intervención humana, lo que supone un gran éxito. Para los fines que no se pueden realizar de forma autónoma, su función de autosupervisión permite que el ser humano sepa sobre la necesidad de realizar la tarea. Cuando se trata de la importancia de Google Duplex, es beneficioso tanto para las empresas como para los usuarios. Todas las organizaciones que confían en los servicios de base de citas, los usuarios pueden reservarlos sin estar ellos mismos en la llamada.