Passer au contenu

La grosse annonce : le contenu Flash enfin indexé par Google et Yahoo ?

Adobe et Google ont annoncé hier que le contenu textuel des sites en Flash allait enfin pouvoir être indexé dans Google et Yahoo. S’il convient de…

Adobe et Google ont annoncé hier que le contenu textuel des sites en Flash allait enfin pouvoir être indexé dans Google et Yahoo.
S’il convient de rester prudent face à une telle annonce, qui a déjà été faite me semble-t-il à plusieurs reprises par le passé, il s’agirait quand même d’une petite révolution dans le monde du développement web et chez les professionnels du référencement.
Il est probable que Adobe ait fini par comprendre que la quasi-impossibilité de référencer correctement du contenu en Flash nuisait au développement de sa plate-forme Flash, et par là-même à la croissance des applications rich-media.
Adobe affirme avoir travaillé de concert avec Yahoo et Google pour que les robots de ces moteurs arrivent à identifier et analyser le contenu textuel inclus dans les fichiers SWF et les incluent dans les pages de résultats des recherches.
Google a d’ores et déjà commencé à indexer le contenu Flash (Yahoo pas encore) et tous les fichiers SWF déjà existants sont éligibles en l’état au crawl par les spiders de Google. Aucune modification n’est nécessaire, et les développeurs Flash pourront continuer à travailler de la même façon sans modifier quoique ce soit dans leurs habitudes. Les applications Flex sont également concernées par cette annonce.
Annonce qui pose quand même un certain nombre de question en matière de SEO et d’accessibilité :

  • cette indexation va-t-elle modifier la façon de programmer un fichier SWF afin qu’il soit optimisé pour les moteurs de recherche ? Autrement dit y aura-t-il rapidement de nouvelles pratiques de SEO liées à cette possibilité ?
  • le classement des résultats dans Google et Yahoo va-t-il être bouleversé par cette nouvelle donne ? Autrement dit quelle sera la valeur en termes de positionnement d’un site Flash par rapport au même site en HTML ?
  • quand on parle de Flash, se pose aussi la problématique de l’accessibilité : si Google arrive à déchiffrer le contenu textuel encapsulé dans un fichier SWF, pourrait-on imaginer qu’un navigateur puisse le faire et renvoyer ainsi aux personnes déficientes visuelles un texte lisible dans un lecteur d’écran ?
  • quid de la sémantique ? Comment Google va-t-il analyser du texte brut extrait d’un fichier Flash si celui-ci n’est pas organisé par les balises sémantiques qui hiérarchisent un document (X)HTML ?

Les experts de Flash et du SEO ne tarderont certainement pas à apporter des réponses à ces interrogations.
Pas sûr que les tenants de l’accessibilité, eux, voient cela d’un très bon oeil.
Sans mauvais jeu de mot, bien sûr.

Pour en savoir plus :
http://googlewebmastercentral.blogspot.com/2008/06/improved-flash-indexing.html
http://www.adobe.com/devnet/flashplayer/articles/swf_searchability.html

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera
64 commentaires
64 commentaires
  1. Ce qui signifie également que toutes les publicités en flash seront indexés.. Un équivalent au NoFollow pour les urls existerait-il en flash ?

  2. Et zut, un des meilleurs arguments pour décourager les clients de demander du flash est en train de disparaitre… Bon il reste encore l’accessibilité…

  3. Ca va effectivement changer la donne. Mais il est logique de penser que le bon vieux html a encore de beaux jours devant lui en matière de référencement et d’accessibilité. Un spider ou un lecteur d’écran ne pourra jamais décortiquer aussi aisément du Flash que la méthode traditionnelle.

    Dans l’immédiat, je dirais que les décisions de pencher vers Flash pour un site devraient être moins douloureuses, mais au final, je trouve que Flash doit toujours être une solution de dernier recours.

  4. Cette annonce ressemble plus a un accord de coopération entre Google et Adobe qu’a une vraie avancée en matière de CEO.
    Même si Google prend (un peu) mieux en charge les fichiers SWF, je ne vois pas comment GG pourrait comparer des milliers de pages HTML avec le contenu dans un flash (y’a combien de pages dans un flash ?).
    De plus seul le fichier flash est pris en compte mais absolument pas les fichiers XML importés… et le fait d’embeder un flash en javascript ne permettra pas à GG de le lire…
    Bref ce n’est pas gagné.. et on est pas prêt de voir des sites full flash en tête de grosses requêtes… mais si deja GG affiche autre chose que le title ça sera déjà pas mal…

  5. Tiens, ton sujet m’interpelle car j’ai découvert il y a peu le nouveau site de Renault (Flash + 3D) et je me demandais comment étaient indexés ce genre de sites …

  6. Mouai…

    Je reste sur l’idée que Flash = player avant tout, et que ça ne doit pas aller plus loin.

    Parce que Flash necessite un plugin, que sont code n’est pas ouvert et non accessible à tous (les mal-voyants notamment).

    Bref : Flash ne doit à mon avis pas aller plus loin que la vidéo et la musique (et les moutons seront bien gardés).

  7. Je trouve dommage qu’un format propriétaire s’impose comme référence absolue dans sa matière… Un pas de plus pour le flash d’adobe. (qui est d’excellente facture, il faut l’admettre)

  8. Les clients seront peut-être un peu moins frileux au flash alors ? En tous les cas c’est une très bonne nouvelle, mon site “pro” (en lien ici) est en full flash et ça ne m’a jamais causé aucun souci d’accessibilité ni de référencement 😉 L’intérêt de flash reste avant tout de pouvoir avoir une liberté graphique et visuelle nettement plus grande 🙂 Pour finir je me demande comment Google va pouvoir visualiser le “vrai texte” du code ou des commentaires.. En effet, rien ne m’empêche de rajouter du texte que l’on ne voit pas pour être mieux indéxé… ^^ m’enfin, je dis ça, je dis rien :-p

  9. Et l’indexation des pages en Ajax, c’est pour quand ? Si Google sait interpréter le Flash, ça doit pas être plus compliqué de lui faire interpréter du JavaScript…

  10. mouais,

    on y est pas encore…
    la nouveauté c’est qu’adobe commence a trouver des solutions, mais personnellement, je ne crois pas que l’on verra rapidement du contenu flash indexé.

  11. C’est une bonne nouvelle pour les référenceurs, maintenant il va falloir comprendre les mécanismes pour travailler sur la popularité.

  12. Moi ce qui me fait peur, c’est que Google pourra lire les textes et les liens encapsulés, mais aura t’il l’a possibilité de comprendre la mise en forme (textes écrits en petit ou caché, … )?
    Si ce n’est pas possible de vielles techniques techniques de gruges en SEO vont réapparaitre, et sa c’est mal !

  13. C’est pas encore une révolution mais c’est une jolie évolution. Dans les faits, un site 100% flash restera toujours très limité, notamment par le fait d’avoir qu’une seule page.

    Pour un site Flash avec plusieurs pages, ça devient plus intéressant mais encore faut il que le texte dans le flash soit du vrai texte (non vectorisé donc) et surtout, comme tu l’indiques en question, il manque un élément important : le balisage “hiérarchique” type H1, H2, gras, etc…

    Le jour où un site flash se positionnera devant Wikipedia n’est pas encore arrivé mais c’est en tout cas un premier pas intéressant.

    A noter qu’un autre moteur avait commencé cette démarche il y a quelques année : Alltheweb. Démarche stoppée par le rachat par Yahoo et la fusion avec la techno Inktomi.

  14. @Cyrillus : plus compliqué de prendre en compte du JS mais ceci étant, il est possible d’indexer du contenu sur lequel il y a un comportement Ajax. Il suffit de “scinder” contenu et comportement.

  15. @Kerweb comme je l’ai écrit plus haut, les fichiers satellites ne sont pas géré par GG (voir sur leur blog)…
    Pour faire du SEO, il faut donc référencer ces fichiers autrement…

  16. @Geoffrey Dorne >Sans vouloir trop entrer dans le hors sujet, je suis sûre que votre site ne VOUS a causé aucune problème d’accessibilité, mais qu’en est-t’il des autres visiteurs ? (notamment ceux ayant des problèmes de vue ?)

    Pour ce qui est de l’indexation du Flash par les moteurs, c’est pas une mauvaise chose; même si comme je souligne Daweb, c’est un bon argument pour détourner les clients du Flash qui s’envole. Mais il reste quand même le fait qu’avec le full flash le bookmarking est un enfer.

    Et je suis également curieuse de voir comment sera présenté le contenu Flash par rapport à l’HTML

  17. Les Flash intégrés via Javascript ne seront pas pris en compte.

    Ce n’est pas du tout une révolution : pas de linking interne, pas de hiérarchisation du contenu, uniquement du texte brut.

    La seule amélioration est que Google sera capable de reconnaitre les URL dans le texte, ce qui fera un lien externe comptabilisé je pense.

  18. Comme dit précédemment, le Flash ne devrait-il pas rester un plus dans un site web? Car, en plus d’être propriétaire, il faut installer un plug-in et le Flash peut être lourd.

    Mais cette techno offre des possibilités intéressantes d’animation, l’utiliser à bonne escient sera la bonne solution je pense (pas de full flash en gros).

  19. J’avais annoncé sur mon twitter il y a plus d’un mois et dans une totale indifférence que Google indexait et lisait le flash (ce qui ne me plait pas mais c’est un autre débat) avec un lien à l’appui.

    Ravi qu’on l’annonce enfin

  20. Je confirme (après plusieurs cessions de test d’ergo pour des clients) : le flash est un gros problème pour l’ergonomie et l’accessibilité; surtout quand il s’agit d’un site fullflash…
    Mais il est également nécessaire pour donner un semblant de graphisme de qualité et d’animation..
    Donc, au lieu de prendre parti pour un extrême, cherchons un bon équilibre dans nos sites…

  21. @Sora –> en fait, mon site est un site où il n’y a que des images, des animations.. je vois pas ce qu’une personne non-voyante viendrait faire dessus ^^ (même pas de son en plus!)

  22. Il était temps !

    @cr0vax Il est vrai que Google lisait le Flash depuis un petit moment

    Un site full Flash à suivre quant à son positionnement Google : http://www.orisinal.com
    Ce site Full Flash regroupant de nombreux et sympathiques jeux en Flash dispose de l’audience et de l’ancienneté utiles pour son étude SEO

  23. @ Geoffrey Dorne > l’accessibilité ne concerne pas seulement les personnes non voyantes…

    Il y a aussi ceux qui voit tout simplement mal et qui sont incapable de grossir le texte, ceux qui ont des problèmes cognitif et qui ne comprendront pas comment fonctionne votre navigation, ceux qui n’ont pas envie d’installer un plugin supplémentaire, ceux qui sont au 56k (ou moins) et qui abandonneront en cours parce que le site se charge à une allure d’escargot. Et bien plus encore !

  24. Je rejoints Sora sur l’accessibilité du flash.
    Et j’élargi : Si flash est utilisé pour autre chose que des animations, c’est le bordel : impossible de grossir le texte (le soir j’aime m’éloigner un peu de mon écran et naviguer avec un léger zoom), impossible de faire une recherche dedans, rarement possible de copier coller, etc.

    Bref toutes les fonctions du navigateur (qui je le rappellent ont un sens) sont inopérantes, rendant le site inaccessible pour tout le monde, pas seulement pour les handicapés.

  25. C’est dommage de considérer encor que flash n’est util que pour les animations. » Moi par exemple je travail sur une appli en Flex depuis un an et je peux vous assurer qu’ au niveau du code (as3+mxml) comme au niveau de l’interface, les possibilités sont impressionnantes. Beaucoup de sites (la fnac par exmple) utilisent déjà cette technologie pour comparer, trier ou présenter leurs produits, et ça n’a rien de superflue ! Ce n’est pas une simple animation graphique 😉

  26. Il y a un point très important pour le référencement Flash, c’est de savoir si le deep linking sera possible.
    Soit google va regarder l’intégralité de l’appli pour en extraire les mots clefs et pointer vers la home (bof)
    Soit il va permettre d’aller au sein de l’appli (imaginer un digg-like en flash) mais dans ce cas, ca nécessite de modifier les applis flash pour supporter le deeplinking avec Flex 3

    Pour avoir testé, je peux vous garantir que coder une application en Flex 2 ou 3 c’est infiniment plus rapide, efficace, maintenable et satisfaisant qu’en AJAX. C’est donc une annonce extrêmement importante.

  27. Ah, encore une jolie mesure qui court à la perte du web. kewoul. Le Flash est une plaie pour le web du contenu, donc le web qui a besoin d’être indexé. Tout ce qui transmet une information devrait être accessible à tous le monde, et quoi qu’on en dise c’est possible uniquement avec certains standards, comme l’HTML (le SVG est quand à lui accessible, mais peu de gens peuvent l’afficher correctement). Flash n’est qu’un artifice. Certes pour afficher une pub, une animation ou un jeu c’est le pied, mais ça ne doit pas dépasser ce cadre ! Il n’a pas été crée pour ça, tandis que l’HTML lui, si.

    Et ensuite je crois qu’Adobe se met le doigt dans l’œil, le problème n’est pas d’aider tous les moteurs de recherche à indexer une technologie, mais de permettre à cette technologie d’être indexée par tous les moteurs de recherche ! Il n’y a pas que Google et Yahoo, il y en a plein d’autres, comme par exemple l’excellent Exalead, que j’utilise tous les jours.

  28. @cr0vax : Si tu veux…:p
    Plus sérieusement, sur ce point tu as raison. On peut quand même mettre en place certaines fonctionnalités,(un bouton pour choisir la taille du texte par exemple…)Fin bon, je ne vais pas essayer de te convaincre d’utiliser Flex a tout prix, je dis juste qu’ ‘il ne faut pas résumer son utilité à des animations graphiques. (Ca j’en démordrais pas 😉 )

  29. * cette indexation va-t-elle modifier la façon de programmer un fichier SWF

    D’après le trio, c’est Adobe qui va faire que son lecteur Flash puisse accepter les robots. Pour tous les webmasters et habitués de Flash, en principe aucun changement dans la façon de faire du Flash donc.

    * quand on parle de Flash, se pose aussi la problématique de l’accessibilité

    Ce serai génial que cela puisse permettre une certaine accessibilité pour les personnes nécessitantes. Cependant, il convient de préciser que le robot ne pourra que extraire le texte et suivre les liens. Pas d’images, que du textuel.

    * quid de la sémantique ? Comment Google va-t-il analyser du texte brut extrait d’un fichier Flash si celui-ci n’est pas organisé par les balises sémantiques qui hiérarchisent un document (X)HTML ?

    D’après l’accord. Adobe va devoir mettre au point un algorithme qui permettra aux robots de simuler un comportement humain face à une application flash. Des robots plus intelligents donc, mais surtout le lecteur Flash devrait produire ua passage du robot un texte qui lui sera compréhensible.
    Mais je doute que les spécifications seront données, car l’accord est sélectif (Exalead, Live Search et compagnie ne pourront toujours pas indexer du Flash).

  30. Moi j’imagine bien la tronche des gens de chez Microsoft avec leur techno SilverLight, je vous rassure ça n’a de Light que le nom voir de silver aussi pour eux.
    Les commentaires doivent être du style : purée Google fait ch…., il indexe le flash, tu vois Bill (à zut il est plus là..) nous aurions dû bosser avec eux.

    Voir le site Web Microsoft et les démos de SilverLight, un grand moment !

  31. Google pour indexer attrape le texte le découpe en mot et zou (repère même pas la langue), c’est fini.
    Après les ranks et tout et tout c’est des ajouts et recoupement avec leurs énormes puissance de traitement.
    Donc le seul problème pour les robots c’est d’être sûr que c’est vraiment du texte.
    Même avec de très simple page html datant des années 94, c’est pas simple.

  32. @Vincent Lg : pas la peine de me convaincre d’utiliser Flex, je développe avec Flex. C’est un bon framework, mais soyons sérieux, à l’heure des mashups, des flux RSS et tout le tintouin, c’est complètement ringard d’enfermer le contenu.

    Or quand le contenu est dans un .swf, c’est bien ça qu’il est : enfermé !

    Bien sûr, le développeur peut s’amuser à redévelopper les fonctionalités du navigateur, mais bon c’est absurde, ça n’a pas de sens, et comment fera le développeur quand la nouvelle génération d’OS arrivera ? Quand le web sera intégré à l’OS ? On recodera les fonctionnalités de l’OS en flash ? 😀

    De plus, avec la multiplicité des plateformes mobiles et autres, flash va se priver de beaucoup d’utilisateurs, car il n’est pas dans les plans d’adobe de gérer tout les players.

  33. @Philippe

    AJAX ou plutôt Ajax (petite occupation pour votre soirée, pourquoi en majuscule et minuscule c’est pas la même chose ? C’est pas de moi c’est du W3C, je vous jure ils ont rien d’autre à faire..)

    Alors donc, Ajax, car de l’AJAX c’est super rare, c’est une techno asynchrone, c’est plus du client/serveur mais dernière génération.
    Sur cette techno c’est impossible d’indexer car même le navigateur lui même, pourtant il doit être au courant lui vu qu’il affiche, ne sait pas trop ce qu’il a en mémoire.
    Pour la partie AJAX ou Ajax, c’est les flux RSS qu’il faut utiliser pour l’indexation, donc ça existe depuis longtemps ben voui car ça vient de cette techno, les flux RSS c’est du XML.

  34. Moi je trouve que c’est une mauvaise nouvelle car cela va encourager le flash quand le javascript suffit pour la plupart des cas (je le dis après avoir eu mon passage “wouhou le flash c’est trop cool je vais plus utiliser que ca” et maintenant je ne l’utilise plus du tout). A mon gout la meilleure pratique est:
    – un site suivant au maximum les recommandations du W3C, avec un minimum de design et toutes les fonctionnalités disponibles
    – le design rajouté par javascript
    – quelques javascript qui modifient la page pour utiliser les méthodes sans recharger la page a chaque fois (par exemple je réécris mes formulaire pour ajouter des validations en temps réel, des changements de page sans tout recharger)
    -au pire quelques flashs pour la vidéo, ou pour les quelques autres trucs qui ne peuvent pas être faits en javascript

    Comme cela pour les personnes qui ont des problèmes d’accessibilité ou de navigateur obsolète il n’y a aucun problème (et le PC ne rame pas en chargeant 15 pubs en flash, pubs se contentant d’afficher une image…).

    Donc pour en revenir a l’article donc, non je ne suis pas pour du tout.

  35. Ca fait longtemps que le flash est indéxé… le pb reste que google restitue les swf et non la page qui contient le swf dans ses résultats

  36. ah merci Thomas. Cela fait effectivement des années que Google indexe les fichier SWF contenant du texte, et cela fait des années qu’ils n’apparaissent dans les résultats de recherche que si on recherche spécifiquement des fichiers en flash (filetype:swf).

    Alors qu’est-ce qui va changer? Les résultats contenant du flash seront mieux classés dans les pages de résultats de recherche ? Ca m’étonnerait, il n’y a pas de raison que le flash sorte mieux que du PDF par exemple.

    Une vraie anvancée serait la hiérarchisation du contenu textuel des fichiers SWF, de la même manière que le HTML: balises titres, etc.

  37. C’est une bonne nouvelle cela va vraiment aider le développement des sites en Flash. Perso je ne suis absolument pas fan de ce type de site mais c’est un vrai progrès dans le référencement.

    Par contre je me demande pourquoi cela a prit tellement de temps sachant que les sites en 100% flash existent depuis presque 8 ans.

  38. C’est une nouvelle en effet mais est-elle bonne ?

    Je ne sais pas, le flash à pour lui la liberté graphique mais pose de gros problème d’accessibilité et d’ergonomie.

    Après je demande à voir ce qui va se passer dans le futur avant de juger.

    Pierre

  39. Difficile de se prononcer car bcp de personnes utilisent des flash provenant d’autres sites dans leur page, alors vers qui sera dirigé le lien ?
    Moi je suis plutot pour Ajax !!!

  40. J’avais fait quelques test, en faite ce qui est indexé c’est juste le texte, donc pas de lien pas de structure, ca ne marche qu’avec un texte statique dans le flash donc ca ne sert a rien. 1 ans après, je vois toujours pas de site en flash qui prennent les premières positions des SERP.

  41. Bonjour,

    J’ai lu ici quelque chose qui dit que rien empèche de cacher des mots pour être mieux indexer.
    Si vous lisez la charte Google, vous verriez que les bots s’apperçoivent et qu’ils n’indexeront plus les pages qui contiennent de la triche.

    Autant avoir un bon contenu textuel c’est plus efficaces.

  42. C’est vrai qu’un site en entièrement en flash risque d’avoir toujours des difficultés à se positionner correctement sur les SERP et pourtant je trouve que cela apporte quand même des avantages. D’abord parce que je pense qu’un site peut très bien avoir une petite dose de flash, que ce soit des bannières ou des animations pour rendre le site plus “vivant”
    Actuellement les liens de ces bannières contenu dans le flash ne sont pas vraiment lu par les moteurs de recherches, c’est pourquoi je pense que c’est une bonne chose si Google arrive à lire correctement le flash.

    Les sites 100% flash sont très mal indexé à par peut-être les très grosses marques qui sortent sur leur propre marque en requête (simplement parce qu’en théorie personne ne peut utiliser cette marque, ca aide quand meme) mais alors pour le reste…jamais vu de site 100% flash premier sur une requete “utile”

  43. @Mapics : effectivement depuis cet été, j’ai quelques sites que j’ai fais en full flash qui ont augmentés leurs trafics, sur le moment je cherchais une explication jusqu’à que je constate que GG avais indexé et lu le texte de certain endroit de ces sites !

  44. Google était déjà en mesure d’interpréter le texte inséré dans des animations et sites flash. depuis quelques mois.
    Je m’en suis aperçu quand suite à quelques tests, du texte présent dans une anim flash a été repris dans le snipet.

    Jusqu’à ce moment, je pensais que flash était voué à disparaitre avec l’arrivée d’ HTML5… Mais si Google et Adobe ont investit, je pense que flash a encore de belles heures devant lui.

  45. Bonjour
    Il serait peut-être temps de mettre cette annonce ‘prometteuse’ à jour : Google indexe effectivement les fichiers *.swf, mais pour une page sans ActionScript, il n’y a toujours aucune possibilité de référencement sérieux en Flash pur …

  46. Tout a fait dac avec la souris 🙂

    il faut vraiment le mettre a jour parce que la page est bien référencé mais le contenu reste flou alors que les retours d’expérience sur l’indexation du flash aujourd’hui sont devenus clair

  47. Ce n’est pas “la grosse annonce” mais la “grosse arnaque” qu’il faudrait noter !
    flash + ActionScript = OK si bien fait (?)
    sinon, rien de nouveau actuellement en fait
    c’est un problème connu depuis des lustres et qui pour le référencement des sites, demande de passer par des chemins “dérivés” …

  48. Je ne comprend pas pourquoi on s’acharne encore à faire de sites en flash… Vive le javascript.
    Laissons tomber flash produit adobe, pour évoluer vers un javascript de plus en plus performant ou vers l’HTML5.

    En plus les clients croient souvent que le graphisme est mieux quand tout bouge c’est une erreur.
    Internet est un média d’information, les graphistes doivent savoir s’adapter pour mettre en avant l’information de façon ergonomique, simple et accessible.

    Un designer.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *