Uma nova patente concedida à Microsoft pelo Escritório de Patentes e Marcas dos Estados Unidos (USPTO) revela que a empresa está trabalhando em agentes de conversação que refletem o estilo de conversação e / ou expressões faciais dos usuários.
A patente – Linguistic Style Matching Agent – foi concedida à Microsoft em 3 de setembro de 2020 e credita Daniel J McDuff, Kael R. Rowan, Mary P. Czerwinski, Deepali Aneja e Rens Hoegen como inventores.
Com os avanços nos modelos de reconhecimento de fala e diálogo, as interfaces de conversação, como chatbots e agentes virtuais, estão se tornando cada vez mais populares.
Embora essas interações de linguagem natural tenham levado a uma evolução nas interações homem-computador, a comunicação é principalmente monotônica e restrita.
RELACIONADOS:
Nvidia GeForce RTX 3090 é mais alta que um Xbox Series X
Galaxy Z Fold 2: veja como é o novo smartphone dobrável da Samsung
Galaxy M51: novo celular da Samsung tem bateria de 7000mAh e quatro câmeras
Essas conversas, portanto, acabam sendo breves e pouco naturais.
Esta nova tecnologia patenteada tem como objetivo trazer um agente de conversação de ponta a ponta baseado em voz que pode se envolver em um diálogo mais natural e capaz de se alinhar ao estilo de conversação e expressões faciais do usuário.
Confira algumas das notas no registro:
- Um agente conversacional que é implementado como um agente apenas de voz ou incorporado a um rosto pode corresponder à fala e às expressões faciais de um usuário.
- A correspondência de estilo linguístico pelo agente conversacional pode ser implementada identificando características prosódicas da fala do usuário e sintetizando a fala para o agente virtual com as mesmas características ou características semelhantes.
- As expressões faciais do usuário podem ser identificadas e imitadas pelo rosto de um agente de conversação incorporado.
- As declarações do agente virtual podem ser baseadas em uma combinação de respostas com script predeterminadas e respostas abertas geradas por técnicas de aprendizado de máquina.
- Um agente conversacional que se alinha ao estilo conversacional e às expressões faciais do usuário pode ser percebido como mais confiável, mais fácil de entender e criar uma interação homem-máquina mais natural.
Tudo isso pode ser feito apenas com áudio ou através de um robô com um corpo humanoide.
Em ambas as implementações, o agente pode usar técnicas de aprendizado de máquina (machine learning) e responder aos enunciados de um usuário de uma forma natural e compreensível, melhorando assim as interações homem-máquina como um todo.
Imagem chamada: Foto: Reprodução/Wikimedia Commons