Construire un Corpus Discours Multilingue

DataForce prend en charge un leader mondial du mat¨¦riel audio avec des donn¨¦es de haute qualit¨¦ pour affiner son moteur ASR.

Le probl¨¨me

Les syst¨¨mes de reconnaissance automatique de la parole (ASR) peuvent convertir les commandes de l'utilisateur en texte qui est ensuite trait¨¦ par des syst¨¨mes de traitement du langage naturel. Pour avoir une mise en ?uvre ASR efficace, il faut tenir compte de plusieurs aspects, tels que les variations de son et de voix selon les sexes, les groupes d'?ge, les accents et les dialectes, ainsi que le bruit de fond associ¨¦ ¨¤ l'environnement o¨´ le syst¨¨me ASR sera utilis¨¦. Dans ce cas, le client devait collecter des donn¨¦es de formation et de test aupr¨¨s de plusieurs groupes d¨¦mographiques en anglais, hindi, allemand, fran?ais et italien.

La solution

DataForce a collect¨¦ des donn¨¦es vocales et du bruit de fond dans plusieurs sc¨¦narios ¨¤ l'aide de notre application mobile exclusive, DataForce Contribute. Notre application s'est assur¨¦e que les fichiers audio respectaient toutes les exigences techniques, telles que le rapport signal sur bruit et le taux d'¨¦chantillonnage. Apr¨¨s avoir collect¨¦ toutes les commandes vocales et le bruit ambiant dans les conditions de stationnement, de conduite et de fen¨ºtres ouvertes/ferm¨¦es, la convolution des ondes sonores a permis de cr¨¦er des ensembles de donn¨¦es simulant un environnement r¨¦el. Avec la solution de DataForce, le client a d¨¦velopp¨¦ et test¨¦ un moteur ASR efficace capable de comprendre les commandes vocales dans plusieurs langues dans diff¨¦rents sc¨¦narios.

Audio Wave

?

?

?