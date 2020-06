Le traitement numérique de la musique est certainement l’une des applications les plus fascinantes de l’informatique au cours des vingt dernières années. Et il se pourrait que cela continue avec l’introduction d’algorithmes d’intelligence artificielle au service des musiciens, producteurs ou DJs.

Parmi les fonctionnalités certainement les plus recherchées par ces derniers, la possibilité de « disséquer » un morceau pour en extraire une piste en particulier, vocale, rythmique ou instrumentale arrive en bonne place, afin d’apporter de la variété à un mix. Pouvoir par exemple transformer un passage d’une chanson en version a capella ou au contraire instrumentale, ou encore n’en jouer que les percussions, est une promesse plutôt tentante.

Il existe déjà des services pour cela, qui permettent d’acheter des chansons dans une version « source » dont quatre pistes sont séparées, mais l’offre est relativement limitée et coûteuse. D’autres moyens sont utilisés, faisant appel à la fréquence sonore d’un instrument particulier, y compris la voix (qui est un instrument parmi d’autres). Si par exemple dans une chanson la fréquence de la voix principale est de 200 Hz, on pourra utiliser des outils qui permettent d’isoler précisément cette fréquence et de la faire disparaitre de la chanson. Les résultats sont souvent assez convaincants mais pas très « propres » avec une écoute attentive. D’autre part, cette méthode va supprimer toutes les autres notes et harmoniques correspondant à la même fréquence, car elle ne fait pas la distinction entre les instruments.

Avant de remixer il faut pouvoir « démixer »

C’est ici qu’intervient l’intelligence artificielle. Au même titre que notre cerveau est capable de faire la différence entre différents instruments (sans pour autant avoir la capacité de les entendre de façon totalement isolée), un algorithme est désormais capable d’agir en temps réel pour séparer différentes pistes d’une chanson.

C’est ce que propose la nouvelle version de l’application Djay Pro, justement nommée Djay Pro AI. Avec sa technologie Neural Mix et en s’appuyant sur le framework Core ML d’Apple et la puce A12 Bionic ou supérieure, l’application est capable d’identifier les différentes pistes audio d’une musique en temps réel pendant sa lecture afin d’en jouer seulement les vocaux, la batterie ou la partie instrumentale, avec toutes les combinaisons possibles entre ces trois sources,et ce en agissant simplement sur trois tirettes. Le résultat est étonnant, et même s’il n’est pas encore parfait ni assez granularisé car on parle de trois sources alors qu’un morceau est souvent enregistré en 48, 64 pistes ou encore davantage, il est plus précis qu’avec la méthode de l’isolement des fréquences.

En fait, cette fonctionnalité est comparable à ce que proposent désormais certaines applications de traitement d’image qui utilisent l’IA pour détourer une photo ou en flouter le fond en identifiant puis en séparant l’arrière plan du premier plan. Ces apps sont donc capables de « déconstruire » une œuvre à partir d’un fichier unique « aplati » afin d’en extraire les différents éléments pour les traiter séparément. Ce qui ouvre des possibilités infinies mais peut également poser des questions autour de la création et du caractère inaltérable d’une œuvre telle qu’elle a été conçue par son auteur.

Djay Pro AI Neural Mix est disponible sur l’App Store pour un abonnement mensuel de 5 euros. Il existe une version d’essai gratuite de la version Pro valable une semaine, largement de quoi en tester les réelles possibilité.