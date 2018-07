Les assistants vocaux se vendent comme des petits pains et le podcast est de nouveau tendance : un enjeu de taille pour les éditeurs, a fortiori les médias écrits.

S’adapter ou mourir ? Avant, les choses étaient simples pour les médias. Avec seulement trois canaux principaux de diffusion (télévision, radio, journaux), chacun faisait son beurre sur son flux de prédilection, et tout le monde était à peu près content. Et surtout, si chaque média avait ses propres codes et son propre langage, il était assez rare qu’il s’aventure en dehors de sa chasse gardée. Ainsi TF1 ne faisait pas de radio, et le New York Times n’avait pas de chaine de télé.

Mais ça c’était avant. Bien avant.

Avec internet, la donne a complètement changé, et les canaux de diffusion se sont démultipliés, générant ex nihilo leur propre langage. Si ceux qui rédigent pour le web savent depuis longtemps qu’on n’écrit pas de la même façon pour Google ou pour Facebook, ils ont également vite appris – parfois dans la douleur – à adapter leurs contenus aux différents moyens d’atteindre leur audience : messages courts sur Twitter, « long forms » sur Medium, stories éphémères sur Snap ou Instagram, messages pratiques sur Slack, articles en images sur un blog, épingles sur Pinterest, vidéos courtes sur Facebook ou légèrement putaclic sur YouTube, VR, « listicles »… Autant de « médias » qui ont créé leurs propres codes.

Après avoir – avec plus ou moins de réussite – pris la mesure de cette déferlante et l’avoir intégrée dans leur flux éditorial, les médias pensaient être tranquilles pour un petit bout de temps. Raté. Patatras, voici que débarquent les assistants vocaux. Et comme un malheur n’arrive jamais seul, ce bon vieux podcast reprend du poil de la bête et devient même le truc tendance de ces derniers mois. Voilà qu’il va falloir une fois de plus remettre l’ouvrage sur le métier, convoquer une nouvelle conférence de rédaction pour comprendre ce qui se passe, puis définir une stratégie éditoriale adaptée. Maudit internet, ça ne s’arrêtera donc jamais ?

A l’âge de l’image, l’audio fait de la résistance

Ironie de l’histoire : à une époque, celle de YouTube et d’Instagram, où l’on ne jure que par la vidéo et l’image, c’est par l’audio qu’arrive la nouvelle donne. Celle-là on ne l’avait pas vraiment vue venir. Du coup, comment s’adapter et proposer des contenus pertinents sur ces nouveaux supports ? La réponse, vous vous en doutez bien, ne se résume certainement pas à une recette magique. En revanche il est peut-être intéressant de voir comment font ceux qui ont déjà intégré les assistants vocaux et le podcast dans leur stratégie de contenus.

Tout d’abord, quelques chiffres pour bien comprendre l’histoire et son contexte. Selon de récentes études, aux USA, un américain sur six est équipé d’un assistant vocal, soit 16% de la population. On estime qu’en 2020 ce sont pas moins de 75 millions d’américains qui utiliseront un smart speaker. Nous n’avons pas de chiffres pour le marché français (ou européen) mais même si la croissance est probablement moins rapide pour différentes raisons (culturelles, entre autres), il est certain que le marché va se développer également très fortement. Autre indice : le taux d’adoption est spectaculaire puisque selon certaines études il serait comparable, voire supérieur à celui du smartphone, ce qui placerait les assistants vocaux en tête des technologies ayant connu la diffusion la plus rapide de tous les temps.

Quid du podcast ? Sans refaire l’histoire de ce format audio, qu vous connaissez certainement aussi bien que moi, sachez simplement que l’on assiste depuis quelques années à une résurgence spectaculaire de leur diffusion. On estime à plus de 500.000 le nombre de podcasts actifs en 100 langages rien que sur Apple Podcasts, alors que leader américain, NPR réunit à titre d’exemple une audience de plus de 16 millions d’auditeurs.

Vous l’avez compris, l’enjeu pour les éditeurs de contenus essentiellement écrits (mais aussi, pourquoi pas, vidéo) est d’adapter ou de transformer leurs articles en fichiers audio. Et pour simplifier les choses, la démarche n’est certainement pas la même pour les assistants vocaux que pour le podcast. Ainsi, les éditeurs intensifient leurs efforts pour créer du contenu spécifique. Au début, la création de contenu pour les assistants vocaux était principalement le travail des chargés des produits. Tout comme pour la télévision et Internet avant, les entreprises de médias ont simplement repris leurs contenus existants et les ont poussés sur des assistants vocaux avec un reformatage minimal. Mais maintenant que les éditeurs cherchent de plus en plus à s’assurer d’avoir une proposition de valeur unique sur les appareils, ils intègrent de plus en plus de ressources éditoriales.

Adapter l’existant ou créer du contenu spécifique pour les assistants vocaux ?

Aux USA, NPR (National Public Radio) compte six personnes dédiées aux assistants vocaux et est en train de créer un poste éditorial qui leur sera dédié. Comme l’indique notre confrère Digiday, le New York Times a publié récemment une offre d’emploi pour un éditeur spécialisé qui aidera le média à adapter « un produit de 150 ans d’âge » à la commande vocale. La personne participera à des projets spéciaux et travaillera sur des prototypes et à la publication de sa première série d’expériences vocales sur ces plateformes.

De son côté, la chaine Al Jazeera vient de nommer un responsable de production éditoriale en vue de déterminer quelles actus existantes seront proposées sur les appareils vocaux et pour travailler sur le contenu qui sera spécifiquement créé pour eux. Le Washington Post a quant à lui également une équipe audio de six personnes en salle de rédaction, indépendantes de l’équipe de développement de l’audience, pour se concentrer sur les assistants à domicile ainsi que sur les podcasts et autres types de récits audio.

Bloomberg Media compte deux ou trois personnes qui travaillent à créer du contenu pour son Market Minute sur l’Apple HomePod, Amazon Echo et Google Home.

En France, Les Échos, L’Équipe, Radio France, Europe 1 et RTL, entre autres ont déjà testé ou lancé des services audio taillés spécifiquement pour être diffusés sur Google Home. Allociné est également présent avec des formats spécifiques. Les marques s’y mettent aussi. Ainsi, le parfumeur Guerlain propose-t-il au consommateur, pardon, à l’auditeur, un diagnostic personnalisé qui lui permet de trouver le parfum qui lui correspond. Des services que l’on peut personnaliser dans l’interface de son assistant, et dont les contenus ne sont pas nécessairement adaptés. Par exemple, si vous demandez les actus à Google Home, vous obtiendrez tout simplement par défaut le dernier journal de France Info.

Alors, comment faire pour adapter ses contenus à la nouvelle donne vocale ? Il y a plusieurs approches.

La première consiste à transformer de façon automatisée ses écrits en fichiers vocaux. Ce n’est pas compliqué. Il suffit d’utiliser une solution, application ou logiciel de text-to-speech, qui convertit automatiquement le texte écrit en voix. C’est redoutablement efficace, et vous avez même cette fonctionnalité intégrée dans iOS, entre autres (vous pouvez demander à votre iPhone de vous lire une page web ou tout autre contenu écrit). Si votre site est sous WordPress, il existe même des plugins qui transforment automatiquement vos articles en podcasts, avec toute la mécanique inhérente, du fichier audio au flux RSS. Si cette méthode fonctionne aussi bien pour les assistants vocaux que pour les podcasts, elle a quand même ses limites : même si les voix de synthèse ont accompli d’énormes progrès, vous n’échapperez pas au côté « voix de robot » et à une certaine monotonie du flux audio au bout d’un moment. Peut-être qu’il serait pertinent d’agrémenter votre audio d’un générique de début et de fin et d’un fond sonore.

L’autre approche, moins simple et probablement plus coûteuse, consiste à engager une personne qui produira des enregistrements vocaux de vos contenus en les lisant. C’est plus naturel, plus humain, et cela peut vous permettre de donner une signature vocale unique à votre audio. S’il existe des agences spécialisées dans la transcription d’audio en écrit, l’inverse est manifestement plus difficile à trouver. Une idée de business à monter ?

D’une façon générale, les formats pour les assistants et pour le podcast sont différents de par leur fréquence : court et quotidien pour l’assistant, plus long et hebdomadaire pour le podcast.

Nous passons de l’âge du search à celui de l’assistant

Mais quelque soit l’approche technique qui finalement peut être gérée relativement aisément, l’enjeu est probablement ailleurs. Je parlais en introduction de cet article du fait que l’on n’écrit pas pour Facebook comme on écrit pour Google. Cette règle est également valable pour les assistants vocaux. L’enjeu ici est de transformer ses contenus afin qu’ils soient « digérables » par les assistants et qu’ils ressortent le mieux possible dans les résultats de recherche. Comme l’indiquait un spécialiste du sujet chez Google, nous sommes en train de passer de l’âge du search à l’âge de l’assistant. Ce qui signifie que nous devrons être en mesure de proposer des contenus formatés pour répondre de façon pertinente et intelligible à une question en langage naturel et non plus proposer une liste de réponses à un mot-clé sans syntaxe (et sans contexte). De quoi repenser ses contenus pour Google Home et autres, et pas seulement transformer du Word en mp3… Pour en savoir plus et vous initier à préparer vos premiers contenus pour Google Assistant, rendez-vous sur Actions on Google. Notez qu’à notre connaissance, il n’est pas possible pour le moment d’identifier la part des recherches vocales ayant conduit à votre site dans Google Analytics. Sachez seulement que Google détient ces chiffres et annonce généralement que 20% des recherches dans son écosystème (moteur de recherche, Android… ) sont faites avec la voix.

De nombreux éditeurs ont déjà utilisé l’automatisation pour convertir leur contenu textuel pour les appareils ou ont simplement pris leurs fichiers audio existants comme des podcasts et les y ont redistribués. Aujourd’hui, en plus de dédier des collaborateurs pour les assistants vocaux, les éditeurs commencent aussi à créer des contenus spécifiques aux appareils, qui sont souvent plus courts que les podcasts réguliers, et avec une fréquence plus élevée (d’hebdomadaire à quotidienne, par exemple). Le Washington Post a ses « Daily 202 » et « Retropod« , des programmes courts et créés pour les haut-parleurs intelligents. De la même manière, NPR a créé un spin-off court et quotidien de son podcast Planet Money appelé « The Indicator« .

L’autre question est d’ordre financier et concerne le modèle de revenus de l’audio. Comment les fabricants inséreront-ils de la publicité dans les appareils sans faire fuir les utilisateurs, et à quoi ressemblera le modèle publicitaire ? Comment l’arrivée d’assistants dotés d’écrans (Amazon Echo Spot…) modifiera-t-il les possibilités de publicité ? Quand et comment les fabricants d’appareils faciliteront-ils la découverte du contenu pour les utilisateurs et tirer le meilleur parti des appareils ?

Autant de questions cruciales pour les médias qui ne veulent pas rater le train des assistants vocaux. Car si ces derniers sont encore probablement sous-utilisés et souvent considérés comme des gadgets amusants à qui l’on pose des questions saugrenues pour tester leurs limites, ils sont là pour rester. Vous avez lu les news sur papier, puis sur smartphone. Il se peut que vous les « lisiez » bientôt via votre assistant vocal. Les sources les mieux indexées rafleront la mise. Et on sait qu’en matière d’indexation, le plus tôt est toujours le mieux…