La voix d’Alexa devient plus rythmée, nuancée et capable de porter des émotions

Afin d’augmenter l’usage de ses enceintes Echo, Amazon créent des intonations vocales qui permettent de véhiculer une émotion ou de rendre le discours plus naturel.

Interagir avec un assistant virtuel peut vite devenir barbant si la voix est trop robotique. C’est pourquoi Amazon vient de lancer « Alexa Emotions and Speaking Styles », deux nouvelles fonctionnalités qui donnent plus de relief à la voix qui sort de l’enceinte connectée Echo.

Ainsi, Alexa dispose désormais de deux modes émotionnels, à savoir « heureux/excité » ou « triste/empathique ». Le premier pourrait, par exemple, être enclenché si « le client répond correctement à une question ou gagne une partie d’un jeu ». Le second serait approprié si « le client demande les informations sportives et que son équipe favorite a perdu ».

Les « Speaking Styles », de leurs côtés, ne sont fait pour véhiculer une émotion, mais pour apporter plus de naturel. Deux modes sont proposés aujourd’hui : informations et musique. Avec eux, la voix d’Alexa pourra prendre les intonations d’un présentateur de journal télévisé ou d’un animateur de radio musicale.

Pour Amazon, l’objectif est évidemment d’accroître les interactions avec son enceinte connectée. D’après le fabricant, ces nouvelles façons de parler augmentent la satisfaction des utilisateurs d’au moins 30 %. Sur le plan technologique, elles sont créées par des algorithmes d’apprentissage automatique baptisés Neural Text-to-Speech (NTTS), qui sont capables de synthétiser des voix sur la base d’un vocoder universel.

Pour l’instant, ces nouvelles intonations ne sont disponibles qu’en langue anglaise. Mais il est fort probable qu’elles seront adaptées aux autres langues.

SourceAmazon