TECHNOPHILE

L’intelligence artificielle exploite la richesse du son

Le traitement du son par des algorithmes est en plein essor.

Le principe du machine learning s’applique désormais à la sphère de l’acoustique. Il s’agit d’alimenter un algorithme avec une grande quantité de données, à partir desquelles il sera capable de reconnaître un objet ou un système. Sur cette base, il va pouvoir apprendre et faire des prévisions de manière indépendante. «Ce principe est maintenant appliqué au domaine du son. Les géants informatiques comme Google ou Microsoft affichent un intérêt très marqué pour ce domaine depuis quelques années», explique Sebastian Tschiatschek, chercheur à l’Institute for Machine Learning à l’ETH de Zurich. Trois innovations s’avèrent particulièrement intéressantes:

Prédire la personnalité
Il suffit d’enregistrer une personne qui parle pendant quinze minutes pour déterminer si elle est optimiste ou qu’elle a confiance en elle. L’algorithme développé par la société allemande Precire se base sur plus de 5’000 échantillons de voix pour réaliser une prédiction sur le caractère d’une personne. Pour l’instant, une vingtaine d’entreprises utilisent Precire pour filtrer les bonnes candidatures lors de leur processus de recrutement. Par conséquent, le nombre d’échantillons de voix enregistrés augmente de façon constante, affirme le CEO Dirk Gratzel. Selon lui, son invention n’en est qu’à ses débuts: elle pourrait également être utilisée dans la publicité lorsqu’il s’agit de s’adresser au public cible dans un certain ton donné. Mais est-ce vraiment fiable? Une étude récente et plusieurs experts semblent le confirmer. L’outil de Precire est même capable de filtrer le changement du timbre de la voix lié au stress.

Une meilleure orientation pour les robots
Une innovation récente du MIT pourra aider les robots à mieux s’orienter dans leur environnement. Les chercheurs ont alimenté un algorithme avec 1’000 vidéos contenant 46’000 sons, pour la plupart des objets sur lesquels on a frappé avec un bâton. En lui présentant une vidéo sans son, l’algorithme était ensuite capable de trouver le son qui va avec. «Prédire les propriétés acoustiques d’un objet peut permettre à un robot de mieux comprendre les caractéristiques des choses qui l’entourent. Il pourra mieux adapter ses interactions avec son environnement», estime Sebastian Tschiatschek.

Imiter la voix d’une autre personne
Le GPS qui vous dirige, le smartphone qui vous lit vos messages et le frigo intelligent qui vous met au courant de l’état de vos aliments — le tout au son de votre voix de prédilection. Cela sera sans doute bientôt possible grâce à CandyVoice, une start-up française qui développe un tel algorithme en partenariat avec Microsoft. A condition d’avoir assez d’échantillons vocaux, il sera possible d’emprunter la voix de n’importe qui.

Pour Matthias Althoff, expert en informatique à la Technische Universität München, cette innovation a beaucoup de potentiel: «La technologie derrière n’est pas très compliquée. Et surtout, il y a une vraie demande: le facteur fun est très élevé.» Sebastian Tschiatschek évoque néanmoins un risque d’abus: grâce à cet outil, il sera par exemple possible de prendre l’identité de quelqu’un d’autre au téléphone. «Il faut espérer que les usages positifs prédomineront.» La start-up proposera également de reproduire sa propre voix: pour cela, il faudra lire à voix haute 160 petites phrases pour que l’algorithme ait assez de matériel pour vous imiter sur différents supports. Le service pourrait aussi aider des personnes qui perdent leur voix suite à un accident ou une opération (pour autant qu’elles créent un fichier vocal avant). D’autres applications proposant le même type de service existent déjà: Voxal Voice Changer et MorphVOX.
_______

Une version de cet article est parue dans le magazine Technologist (no 12).

Pour souscrire un abonnement à Technologist au prix de CHF 45.- (42 euros) pour 8 numéros, rendez-vous sur cialis availability uk.