Google Panda : quelques paramètres du nouvel algorithme

Google Panda est un nouveau filtre mis en place par Google d√©but 2011, d√©j√† d√©ploy√© dans les pays anglophones, et qui sera √©tendu prochainement au reste du monde. Google a travaill√© depuis des mois, voire des ann√©es pour mettre en place Google Panda, en utilisant ce qu’on appelle un « algorithme d’apprentissage ».

Article rédigé par Sébastien de Chezelles, consultant SEO[1]

Google Panda est un nouveau filtre mis en place par Google d√©but 2011, d√©j√† d√©ploy√© dans les pays anglophones, et qui sera √©tendu prochainement au reste du monde. Google a travaill√© depuis des mois, voire des ann√©es pour mettre en place Google Panda, en utilisant ce qu’on appelle un « algorithme d’apprentissage ».

Cela correspond √† avoir pratiqu√© des validations √† la main de centaines de milliers de sites pour d√©tecter s’ils √©taient du contenu type « Ferme de contenu », puis √† mettre en place une multitude de crit√®res pour faire des calculs sur ces √©chantillons afin de s’assurer que les crit√®res du filtre permettaient un minimum d’erreurs.

Suite √† cela, Google a identifi√© une liste de crit√®res pertinents pour d√©terminer que tel ou tel crit√®re signifiait que le site visit√© √©tait du spam afin d’en calculer un sorte de note pour Google Panda, avec des notes positives, ou n√©gatives sur chaque aspect.

Le moteur de recherche d√©termine ensuite que tel ou tel site obtient une note moyenne trop faible pour « Google Panda », m√©ritant donc que le site soit p√©nalis√© dans son algorithme et donc sur son positionnement dans les r√©sultats de recherche (SERP – Search Engine Results Page).

Voici une liste non exhaustive des critères utilisés par Google :

–¬†¬†¬†¬†¬†¬†¬† Le taux de retour sur la page de recherche √† partir de tel ou tel lien

–¬†¬†¬†¬†¬†¬†¬† La dur√©e de visite des pages

–¬†¬†¬†¬†¬†¬†¬† Le trop fort taux de publicit√©

–¬†¬†¬†¬†¬†¬†¬† Le type de landing pages (pages d’entr√©es des internautes)

–¬†¬†¬†¬†¬†¬†¬† La pertinence d’une page avec le mot clef utilis√© pour lui apporter de l’audience : certains forums ont pouss√© le r√©f√©rencement de certaines pages sur des mots clefs sans rapport avec le contenu r√©el de celles-ci

–¬†¬†¬†¬†¬†¬†¬† La qualit√© du contenu de la page (la part des contenus r√©dig√©s rapidement ou √† la va-vite progressait sensiblement aux USA, les sites jouant des techniques de r√©f√©rencement pour prendre de l’audience et faire du CA sans contenu de qualit√©)

–¬†¬†¬†¬†¬†¬†¬† La page apporte-t-elle finalement la r√©ponse √† la question pos√©e par l’internaute faisant la recherche : certains forums ont 90 % de discussions avec une r√©ponse pertinente, quand d’autres concurrents trainent sous la barre des 40 % ; ces derniers √©tant p√©nalis√©s.

–¬†¬†¬†¬†¬†¬†¬† La vitesse d‚Äôaffichage de la page

–¬†¬†¬†¬†¬†¬†¬† Pr√©sence de duplicate et contenus plagi√©s

–¬†¬†¬†¬†¬†¬†¬† Site √©tant interm√©diaire : regroupement de tests pour faire une revue de presse, comparateurs de prix… Semblent moins touch√©s les aggr√©gateurs de contenus dans l’emploi !

–¬†¬†¬†¬†¬†¬†¬† Taux de crawl pour des pages sans int√©r√™t : si Google passe 50 % de son temps de crawl sur des pages dont l’int√©r√™t est nul en terme d’utilisateurs, il baissera la pertinence globale du site

–¬†¬†¬†¬†¬†¬†¬† La pr√©sence de contenus dupliqu√©s

–¬†¬†¬†¬†¬†¬†¬† La pr√©sence de pages pour se r√©f√©rencer sur des termes quasiment identiques, en changeant uniquement quelques mots dans l’article ; voir la cr√©ation de pages pour se r√©f√©rencer sur des requ√™tes avec fautes d’orthographes.

Pour d’autres crit√®res, il n’a pas √©t√© d√©termin√© de mani√®re certaines qu’ils agissaient dans le filtre :

–¬†¬†¬†¬†¬†¬†¬† Le taux de clics sur les liens de tel ou tel site dans Google : si un site attire 20 % de clics de moins qu’un autre, √† position √©gale, il y a un « probl√®me »

–¬†¬†¬†¬†¬†¬†¬† L’√Ęge moyen des pages : certains sites √©taient positionn√©s principalement avec des pages datant de 2003 ou 2004 (d’ou le fait qu’on ait vu r√©cemment apparaitre la date dans les algorithmes)

–¬†¬†¬†¬†¬†¬†¬† Il y a certainement des dizaines d’autres crit√®res servant pour Google Panda, dans une moindre mesure, dont beaucoup ne sont pas connus.

Il faut toutefois veiller √† ce que, m√™me si son site ne devrait pas √™tre p√©nalis√© par Google Panda (qui n’est pas encore sorti en France), √† continuer √† travailler ces crit√®res de qualit√© en optimisant en parall√®le son r√©f√©rencement, √©tant donn√© que Google optimise en permanence Google Panda et pourra faire de nouvelles versions plus strictes.

Note d’Eric : selon certaines informations, Panda serait d√©ploy√© dans le courant du mois d’ao√Ľt en France. Au sujet des mises √† jour de l’algorithme Google, avez-vous remarqu√© que l’on ne parle pratiquement plus jamais du PageRank ? Une mise √† jour du PR a pourtant eu lieu cette semaine, mais elle est pass√©e totalement inaper√ßue.


[1]Sébastien de Chezelles est consultant indépendant en référencement et gérant de la société Web Conseils. Son profil Viadeo : http://www.viadeo.com/fr/profile/sebastien.dechezelles

31 commentaires

  1. tiens c est bizarre, j ai entendu dire que panda était passé au milieu du mois de juin.

  2. Bel article, il va falloir travailler la pertinence !

    Concernant le PR, si la MAJ est pass√©e inaper√ßu, c’est parce que beaucoup se sont cass√©s la gueule ūüôā

  3. C’est un article tr√®s int√©ressant, merci, qui ne me rassure pas pour autant : comment Panda consid√©rera des sites dont le contenu est une base de donn√©e acquise tout √† fait l√©galement sous licence ? Les pages sont similaires avec d’autres sites, la localisation, la finalit√© et les attendus diff√®rent. Ces sites se retrouveront-ils √† la 30√® page du classement ?

  4. La mise √† jour est pass√© inaper√ßue pour la majorit√© car la plupart surveille le PR de la home : ce qui est important c’est le PR de chaque page plus que la home : me concernant j’ai bien remarqu√© la MAJ des PR des pages et la notation des contenus cr√©√©s depuis la derni√®re Google Dance ūüėČ

  5. Multi commentaire:
    On pense que l’update Panda √† √©t√© d√©ploy√© le 15 juin mais il reste des doutes. On penche pour un d√©ploiement partiel ou seulement de quelques « brique »de l’algorithme parce que les implications sur les SERP semblent moins spectaculaires que ce qui s’est pass√© en mars aux USA . D’ailleurs on ne trouve que tr√®s peu d’info sur l’impact de ce d√©ploiement alors que les meilleurs labo de veille SEO (Rank Metric pour ne citer que celui-la) sont bien sur le coup.

    @julien : En effet la remise √† niveau du PR √† donn√© des coups de Bambou √† de nombreux sites qui ne s’en vantent pas. Il y a d’ailleurs de quoi remettre en cause la formule de calcul « officielle » diffus√©e par glouglou.

  6. Cela arrive d√©j√† « trop » tard en France car pas mal de sites ont d√©j√† adapt√©s

  7. J’ai lu sur des forums que Matt Cuts aurait annonc√© un d√©ploiement multilingue de Panda pour juillet.
    Quelles sont ces « informations » qui pr√©voient l’arriv√©e en France an ao√Ľt ?
    Mi-juin, il y a tout de m√™me eu pas mal de mouvements dans les SERPS assez « brutaux » sur des sites francophones, √† quelques jours d’intervalles (Cf. discussions sur WRI)…
    Concernant l’export de PR, je crois tout simplement que les webmasters se focalisent moins sur la taille de leur barre verte.

  8. En effet j’ai constater plusieurs mouvement dans le ranking de mes sites. Certain ont progress√© fortement sans vraiment m’occuper du r√©f√©rencement mais d’autre on aussi chuter beaucoup chuter ūüôā
    Par contre je sais pas du tout si c’est d√Ľ √† Mr panda.
    Ps: La mise √† jour du page rank n’est pas du tout pass√© inaper√ßue sur certain forum :-p

  9. Le PR fait partie des plus de 200 facteurs de l’algorithme de Google. Son importance s’est amoindrie, tout comme la balise keywords.
    Il semble aujourd’hui, surtout avec le lancement de Google+, que Google se tourne de plus en plus vers le TrustRank. A savoir la notori√©t√© et la confiance de chaque auteur dans la blogosph√®re. Et ce TrustRank va avoir, gr√Ęce √† la popularit√© g√©n√©r√©e par le bouton Google +1, beaucoup de poids au moment du classement des pages dans les SERPs.

  10. Non elle n’est pas pass√© inaper√ßu parce que chez nous, on est pass√© de -1 √† 4 ūüôā et donc vive la Google Dance

    • Eric

      @MetLife : …et ici non plus, Presse-citron a regagn√© son PR6 momentan√©ment perdu depuis la pr√©c√©dente ūüôā

  11. Tr√®s bonne explication de Google Panda ! D’ailleurs j’ai appris quelques √©l√©ments dont j’ignorais encore l’importance pour l’application de Google panda en France.

  12. @Eric: inaper√ßue pour toi peut-√™tre. Pas mal d’agitation dans les forums sp√©cialis√©s

    • Eric

      @Axel : oui certainement, mais je trouve que par rapport √† il y a quelques ann√©es l’info n’a pas fait beaucoup de bruit dans les blogs alors que n’importe-quelle Google dance faisait la une des sites tech avant

  13. On peut noter qu’il est toujours mis √† jour (ce qui doit repr√©senter quand m√™me une masse de calculs).

    On ne peut qu’en tenir compte pour √©valuer la sant√© d’un site, mais c’est vrai que ce n’est pas (plus) une garantie de bon positionnement.

  14. Clairement les mises à jour ne correspondent pas à Google Panda, car peu de gros sites ont vu leur audience changée réellement (de + de quelques pourcents) !

    L’on peut par ailleurs voir que tous les agr√©gateurs n’ont pas vu de r√©elle baisse, quel qu‚Äôils soient ! Je pense que Google a bcp de mal √† adapter son algo hors de la langue Anglaise, surtout qu’il ne compte pas d√©ployer pays par pays mais, je pense, pour quasiment l’int√©gralit√© des autres langues d’un coup ; et il ne peut se risquer √† sortir un filtre marchant mal, ce qui lui ferait une tr√®s mauvaise presse.

  15. Parfait cet article ! C’est tout √† fait ce que je cherchais pour cerner un peu mieux le nouvel algorithme mis en place par Google. J’ai d√©j√† eu loisir de voir mon PR changer mais avec des informations comme √ßa je vais savoir quelle technique mettre en place pour optimiser au mieux mon r√©f√©rencement.

  16. Pingback: Interview autours du R√©f√©rencement par Pourquoi-Entreprendre « Consultant SEO

  17. Pingback: Interview SEO par Pourquoi-Entreprendre « Consultant SEO

  18. Bonsoir,

    est-ce que le duplicat content ainsi que la vitesse de t√©l√©chargement d’une page web sont des crit√®res importants dans le classement des sites chez google?

    Merci.

  19. @volière
    Google communique sur le temps de chargement de page parce que cela lui co√Ľte tr√®s cher en crawling. donc oui il faut mieux optimiser ton code et ne pas √™tre trop lourd √† charger.
    Le duplicate content est un des éléments dans la ligne de mire de Panda Рla mise à jour dont tous le monde parle , lis la dessus sur le web tu seras vite convaincu que le contenu prend une importance cruciale incite à un meilleur chargement

  20. @Yanick,

    merci de ta r√©ponse. J’ai en effet un grand nombre d’url dupliqu√©es index√©es dans google. J’essaye de supprimer toutes ces urls depuis les outils propos√©s par google ( suppression url, param√®tres url), mais cela prend un temps long √† d√©sindexer.

    Bonne journée.

  21. C’est le premier article que je lis sur de nombreux qui traitent de la mise √† jour Panda qui donne autant de d√©tails sur les nouveaux crit√®res, quelqu’un a-t-il des informations sur les crit√®res mal connus ?

  22. Pingback: Les premiers impacts de Google Panda sur le web français

  23. Une précision qui me parait importante. Vous écrivez:

    « Site √©tant interm√©diaire : regroupement de tests pour faire une revue de presse, comparateurs de prix‚Ķ Semblent moins touch√©s les aggr√©gateurs de contenus dans l‚Äôemploi ! »

    Ce n’est pas le cas. La seule raison pour laquelle ce type de sites peut √™tre plus touch√© est que souvent ils ne proposent que du contenu dupliqu√©. Un site comparateur avec du contenu unique et appropri√©, ne sera pas touch√©.

    Dans mon cas, je travaille pour un comparateur et nous avons fait de grands bons dans les résultats de recherche.

  24. Le contenu dupliqu√© n’est pas le seul crit√®re qui peut p√©naliser le r√©f√©rencement.

    Je ne sais pas si c’est le fait de Panda, mais j’ai vu sur deux sites le d√©placement des positions de la page 1 vers le fond du classement pour des mots cl√©s tr√®s cibl√©s. Sans doute il a √©t√© jug√© que ces mots cl√©s √©taient sur-optimis√©s.

    C’est intervenu d√©but 2011. Il est clair qu’il y a eu un arbitrage.

    La particularité étant que ces mots clés étaient fortement dominants dans les site et les backlinks, mais sous représentés dans les sites voisins.

    C’est tr√®s bien fait car cela ne p√©nalise qu’un mot cl√©, les autres semblant garder le plein effet.

    Le contenu dupliqu√© n’√©tait pas la cause de cette √©clipse de mots cl√©s.

  25. Depuis Panda (et r√©cemment Pingouin), de plus en plus de site commencent √† se tourner vers le r√©f√©rencement efficace, au d√©triment des m√©thodes plus sombre. Je suis d’accord pour dire que nous sommes plut√īt gris, car avec le temps, nous aimons automatiser certaines taches r√©barbatives, il faut l’avouer.

Lire les articles précédents :
Portraits de technomades : Kalagan

Ils se surnomment "technomades" ou "digital nomades". Une catégorie qui tire profit de l’avantage que procure internet pour être mobile....

Fermer