Technologie vocale: faire le bon choix

Sathish Sastry, responsable du centre d'innovation 3i Voice de Zetes: son avis sur les systèmes vocaux avec et sans apprentissage.

Quelle est la différence entre un système vocal avec et sans apprentissage?

Sathish Sastry: « Un système vocal sans apprentissage est prêt à l'emploi. Il ne nécessite aucun enregistrement de voix préalable de l'opérateur. Un système vocal avec apprentissage doit enregistrer la voix de l'utilisateur qui va donner les instructions. »

Existe-t-il une différence de précision entre ces deux systèmes?

Sathish Sastry: « A la base, un système avec apprentissage est plus précis étant donné que l’utilisateur personnalise son système avec son profil de voix avant de l’utiliser. Toutefois, les systèmes sans apprentissage ont beaucoup progressé au fil des ans. Leurs résultats sont désormais identiques à ceux d'un système vocal avec enregistrement du profil. »

Un système vocal sans apprentissage peut donc être aussi efficace qu'un système avec apprentissage?

Sathish Sastry: « En effet. La nouvelle génération de systèmes vocaux "prêts à l'emploi" concentre un bien plus grand nombre d’informations. À condition d'utiliser un vocabulaire correct dans l'application prise en charge par un système sans apprentissage, ce dernier peut même s’avérer plus efficace.

Dans un système avec apprentissage, l'utilisation d'une langue existante ou non n'a aucune importance. Le système n'est pas tributaire d'un dialecte specifique. On peut donc facilement le formater à l'aide de sons qui ne sont pas de vrais mots. Pour élargir le domaine d'utilisation d'un système sans apprentissage, il est nécessaire de prendre en considération les composantes d’une langue. »

Quels sont les principaux facteurs permettant de choisir l'un des deux systèmes?

Sathish Sastry: « Tout dépend du contexte où va s'exécuter l'application. Un système avec apprentissage est idéal dans un environnement stable, avec une équipe d'utilisateurs qui change peu. Toutefois, dans la réalité, de nombreuses sociétés ont affaire à une importante rotation des travailleurs, parfois recrutés pour seulement quelques jours. Etant donné que le système vocal avec pré-enregistrement du profil peut nécessiter jusqu'à 30 minutes de formation, l’utilisation d'un système sans apprentissage, avec guidage vocal intégré, prêt à l’emploi, peut alors s'avérer plus efficace. »