Tecnologia

Qual o papel da experiência do usuário no voice user interface?

Por: Mutant, agosto 1, 2019

Hoje foi um dia de muito trabalho, o tempo todo diante de um computador, mas faltou escrever este texto sobre Voice User Interface (VUI) para você. Os dedos se cansam depois de um dia como esse. Como alternativa, o Google Docs permite ditar um conteúdo, que é instantaneamente transcrito.

É óbvio que alguns ajustes são necessários posteriormente, mas é ótimo para dar um descanso às mãos. Além disso — e mais importante —, nada poderia vir mais a calhar do que o uso desse recurso no dia de hoje. Ele deixa muito claro o quanto as interfaces de voz podem ser úteis e confortáveis.

De tempos em tempos, surgem algumas tecnologias que mudam totalmente a experiência do usuário, e algumas impactam profundamente nas nossas vidas. Pois é o caso da VUI.

Como ocorreu com este texto, há muito mais que pode ser ditado, o que inclui as suas vontades mais cotidianas, como: “acenda a luz” e “ligue o aquecedor” — antes que seja preciso abandonar os cobertores em uma manhã fria.

As interfaces de voz são altamente intuitivas, e sua aplicação prática já é viável. Isso significa que o processo começou e ninguém quer ser surpreendido quando a mudança estiver consolidada. Sendo assim, continue a leitura e confira!

A naturalidade da Voice User Interface

Muitos de nós observamos a tecnologia mudando as nossas vidas de acordo com a maneira que interagimos com ela. Isso aconteceu com o surgimento do mouse e, mais recentemente, com os smartphones e suas telas deslizantes.

Nada mais natural do que usarmos nossas próprias mãos e dedos para acionar esses mecanismos, mas não em comparação com as VUI, que são as interfaces que permitem a interação de voz entre pessoas e dispositivos.

Com elas, é muito mais fácil e confortável acionar diversos mecanismos que usamos no cotidiano com uso da voz, o que podemos comprovar com pesquisas como a Speak Easy Global Report, que prevê que metade das consultas serão feitas por voz, já em 2020. Você já teve exemplos disso, mas podemos incluir o micro-ondas. Ou existe comparação entre a experiência de dizer “aqueça por 2 minutos” e precisar digitar a mesma informação?

Mesmo que seja necessário um único clique, falar é muito mais natural, fácil e divertido. Sim, em um momento descontraído, não demora muito para maioria de nós começar a brincar com o software, tentando atrapalhá-lo. No entanto, essa tecnologia esteve um pouco distante de nós por limitações técnicas, agora superadas.

A tecnologia que viabiliza a Voice User Interface

Atualmente, podemos contar com capacidade de hardware para processar o grande volume de dados das transmissões de voz, e a Inteligência Artificial (IA) já desenvolveu a capacidade de processar essas informações juntas, usá-las para nos entender e responder de modo coerente.

Essa função é cumprida por uma subárea da IA, chamada de Processamento de Linguagem Natural (PLN). Nela, são desenvolvidos estudos sobre o entendimento da linguagem humana por parte das máquinas. Desse modo, os computadores podem se desenvolver cada vez mais para entender e compor textos.

Nesse contexto, existe uma demanda latente por designers e desenvolvedores com habilidades e conhecimento para projetar e construir sistemas de voz, seja para serem aplicados em autoatendimento, seja para dar suporte a casas inteligentes, seja no seu uso pelos sistemas de streaming de música.

A experiência e a Voice User Interface

Com as informações que reunimos até aqui a força da interação entre a experiência do consumidor e a Voice User Interface já deve estar clara. Mas vale a pena nos aprofundarmos nisso. Muito embora a tecnologia tenha avançado de modo a viabilizar a utilização da VUI, para que a experiência do usuário seja satisfatória, é preciso aplicá-la de forma humanizada ­— o que significa fornecer o subsídio que ela precisa para interagir com qualidade.

Há muito ainda para ensinar as máquinas até que elas sejam capazes de compreender a complexidade do ser humano. E, quando usamos o termo “ensinar” não é força de expressão. O aprendizado de máquina é um recurso fantástico, mas que depende de que possamos desenvolver nossa capacidade de treinar esses sistemas.

No caso da voz, alteramos o tom, o volume, expressamos agressividade, dor, alegria e uma diversidade de sentimentos e reações. Esses padrões precisam ser aprendidos pela IA para que a experiência de interagir com ela evolua.

Isso implica em um grande desafio para os profissionais que atuam como designers da experiência. Eles precisam se especializar em todos os meandros da comunicação humana, e considerando que nenhum usuário tem muita paciência quando não é compreendido. Esperam fluência e compreensão total, mesmo ao interagir com sistemas virtuais.

O conhecimento geral da Machine Learning é importante para conceder e desenhar a interface e estabelecer ligações humanizadas. Atualmente, qualquer um pode criar experiências conversacionais por voz para dispositivos como Alexa e a Siri, e de modo equivalente a desenvolver aplicativos para a Apple Store ou para o Google Play.

Nesse contexto, é preciso manter a conversa simples. O usuário não procura por respostas complexas e profundas, mas elas precisam ser coerentes e precisas. Se você já conversou com alguma máquina de central de atendimento pelo telefone, sabe que não é fácil acertarmos os detalhes.

Por exemplo, um sistema inteligente pode responder algo como “o produto é enviado para o seu endereço”, quando a pessoa solicitar informações sobre a transportadora. Ao perceber que enviou uma resposta errada, especialmente depois de algumas tentativas, o software pode pedir desculpas e dizer “ainda estou aprendendo” — estamos falando de um ótimo e elaborado sistema.

Ao mesmo tempo, os avanços de processamento de linguagem natural e de Machine Learning estão deixando a VUI menos robotizada e mais parecida conosco. Algumas injeções de humor e de personalidade, como o pedido de desculpas do exemplo acima, podem ajudar a humanizar as interfaces de voz, mas o mais importante é fazer com que elas respondam com coerência, de forma direta e objetiva, de modo a entregar o que o usuário solicitou.

No mais, a conveniência e as facilidades de uma conversa por voz já fazem maravilhas por uma boa experiência. Por fim, ainda falta mencionar uma carta na manga da Voice User Interface: ela deixa nossas mãos livres. Considerando essa vantagem, imagine um futuro próximo no qual uma viagem em um carro autônomo pode ser ocupada por uma reunião virtual informal.

Nesse cenário, você ainda pode usar a Voice User Interface para abrir arquivos, transferir recursos e “perguntar para sua casa” se o jardineiro foi cortar a grama, enquanto se serve de algo para comer, que comprou na última parada. Parece uma boa experiência para desejar no futuro? O quanto ele está distante de nós? Talvez nem tão perto quanto gostaríamos, nem longe quanto imaginamos.

Mantenha-se informado! Assine nossa newsletter e receba em primeira mão outros conteúdos como este.

    • Receba nosso conteúdo em primeira mão.