Google Panda : quelques paramètres du nouvel algorithme

Google Panda est un nouveau filtre mis en place par Google début 2011, déjà déployé dans les pays anglophones, et qui sera étendu prochainement au reste du monde. Google a travaillé depuis des mois, voire des années pour mettre en place Google Panda, en utilisant ce qu’on appelle un « algorithme d’apprentissage ».

Article rédigé par Sébastien de Chezelles, consultant SEO[1]

Google Panda est un nouveau filtre mis en place par Google début 2011, déjà déployé dans les pays anglophones, et qui sera étendu prochainement au reste du monde. Google a travaillé depuis des mois, voire des années pour mettre en place Google Panda, en utilisant ce qu’on appelle un « algorithme d’apprentissage ».

Cela correspond à avoir pratiqué des validations à la main de centaines de milliers de sites pour détecter s’ils étaient du contenu type « Ferme de contenu », puis à mettre en place une multitude de critères pour faire des calculs sur ces échantillons afin de s’assurer que les critères du filtre permettaient un minimum d’erreurs.

Suite à cela, Google a identifié une liste de critères pertinents pour déterminer que tel ou tel critère signifiait que le site visité était du spam afin d’en calculer un sorte de note pour Google Panda, avec des notes positives, ou négatives sur chaque aspect.

Le moteur de recherche détermine ensuite que tel ou tel site obtient une note moyenne trop faible pour « Google Panda », méritant donc que le site soit pénalisé dans son algorithme et donc sur son positionnement dans les résultats de recherche (SERP – Search Engine Results Page).

Voici une liste non exhaustive des critères utilisés par Google :

-        Le taux de retour sur la page de recherche à partir de tel ou tel lien

-        La durée de visite des pages

-        Le trop fort taux de publicité

-        Le type de landing pages (pages d’entrées des internautes)

-        La pertinence d’une page avec le mot clef utilisé pour lui apporter de l’audience : certains forums ont poussé le référencement de certaines pages sur des mots clefs sans rapport avec le contenu réel de celles-ci

-        La qualité du contenu de la page (la part des contenus rédigés rapidement ou à la va-vite progressait sensiblement aux USA, les sites jouant des techniques de référencement pour prendre de l’audience et faire du CA sans contenu de qualité)

-        La page apporte-t-elle finalement la réponse à la question posée par l’internaute faisant la recherche : certains forums ont 90 % de discussions avec une réponse pertinente, quand d’autres concurrents trainent sous la barre des 40 % ; ces derniers étant pénalisés.

-        La vitesse d’affichage de la page

-        Présence de duplicate et contenus plagiés

-        Site étant intermédiaire : regroupement de tests pour faire une revue de presse, comparateurs de prix… Semblent moins touchés les aggrégateurs de contenus dans l’emploi !

-        Taux de crawl pour des pages sans intérêt : si Google passe 50 % de son temps de crawl sur des pages dont l’intérêt est nul en terme d’utilisateurs, il baissera la pertinence globale du site

-        La présence de contenus dupliqués

-        La présence de pages pour se référencer sur des termes quasiment identiques, en changeant uniquement quelques mots dans l’article ; voir la création de pages pour se référencer sur des requêtes avec fautes d’orthographes.

Pour d’autres critères, il n’a pas été déterminé de manière certaines qu’ils agissaient dans le filtre :

-        Le taux de clics sur les liens de tel ou tel site dans Google : si un site attire 20 % de clics de moins qu’un autre, à position égale, il y a un « problème »

-        L’âge moyen des pages : certains sites étaient positionnés principalement avec des pages datant de 2003 ou 2004 (d’ou le fait qu’on ait vu récemment apparaitre la date dans les algorithmes)

-        Il y a certainement des dizaines d’autres critères servant pour Google Panda, dans une moindre mesure, dont beaucoup ne sont pas connus.

Il faut toutefois veiller à ce que, même si son site ne devrait pas être pénalisé par Google Panda (qui n’est pas encore sorti en France), à continuer à travailler ces critères de qualité en optimisant en parallèle son référencement, étant donné que Google optimise en permanence Google Panda et pourra faire de nouvelles versions plus strictes.

Note d’Eric : selon certaines informations, Panda serait déployé dans le courant du mois d’août en France. Au sujet des mises à jour de l’algorithme Google, avez-vous remarqué que l’on ne parle pratiquement plus jamais du PageRank ? Une mise à jour du PR a pourtant eu lieu cette semaine, mais elle est passée totalement inaperçue.


[1]Sébastien de Chezelles est consultant indépendant en référencement et gérant de la société Web Conseils. Son profil Viadeo : http://www.viadeo.com/fr/profile/sebastien.dechezelles

Invité
bladebo
2 juillet 2011

tiens c est bizarre, j ai entendu dire que panda était passé au milieu du mois de juin.

Invité
2 juillet 2011

Bel article, il va falloir travailler la pertinence !

Concernant le PR, si la MAJ est passée inaperçu, c’est parce que beaucoup se sont cassés la gueule :-)

Invité
2 juillet 2011

Il me semble que Panda est déployé en France depuis au moins 1 semaine…

Invité
2 juillet 2011

C’est un article très intéressant, merci, qui ne me rassure pas pour autant : comment Panda considérera des sites dont le contenu est une base de donnée acquise tout à fait légalement sous licence ? Les pages sont similaires avec d’autres sites, la localisation, la finalité et les attendus diffèrent. Ces sites se retrouveront-ils à la 30è page du classement ?

Invité
3 juillet 2011

La mise à jour est passé inaperçue pour la majorité car la plupart surveille le PR de la home : ce qui est important c’est le PR de chaque page plus que la home : me concernant j’ai bien remarqué la MAJ des PR des pages et la notation des contenus créés depuis la dernière Google Dance ;)

Membre
3 juillet 2011

Multi commentaire:
On pense que l’update Panda à été déployé le 15 juin mais il reste des doutes. On penche pour un déploiement partiel ou seulement de quelques « brique »de l’algorithme parce que les implications sur les SERP semblent moins spectaculaires que ce qui s’est passé en mars aux USA . D’ailleurs on ne trouve que très peu d’info sur l’impact de ce déploiement alors que les meilleurs labo de veille SEO (Rank Metric pour ne citer que celui-la) sont bien sur le coup.

@julien : En effet la remise à niveau du PR à donné des coups de Bambou à de nombreux sites qui ne s’en vantent pas. Il y a d’ailleurs de quoi remettre en cause la formule de calcul « officielle » diffusée par glouglou.

Invité
David
3 juillet 2011

Cela arrive déjà « trop » tard en France car pas mal de sites ont déjà adaptés

Invité
4 juillet 2011

J’ai lu sur des forums que Matt Cuts aurait annoncé un déploiement multilingue de Panda pour juillet.
Quelles sont ces « informations » qui prévoient l’arrivée en France an août ?
Mi-juin, il y a tout de même eu pas mal de mouvements dans les SERPS assez « brutaux » sur des sites francophones, à quelques jours d’intervalles (Cf. discussions sur WRI)…
Concernant l’export de PR, je crois tout simplement que les webmasters se focalisent moins sur la taille de leur barre verte.

Eric
Admin
4 juillet 2011

VLV : pour le déploiement de Panda an août, plusieurs sources mais en effet d’autres indiquent que c’est déjà fait ou en cours

Invité
4 juillet 2011

Merci pour les infos !

Invité
4 juillet 2011

En effet j’ai constater plusieurs mouvement dans le ranking de mes sites. Certain ont progressé fortement sans vraiment m’occuper du référencement mais d’autre on aussi chuter beaucoup chuter :-)
Par contre je sais pas du tout si c’est dû à Mr panda.
Ps: La mise à jour du page rank n’est pas du tout passé inaperçue sur certain forum :-p

 
Lire les articles précédents :
Portraits de technomades : Kalagan

Ils se surnomment "technomades" ou "digital nomades". Une catégorie qui tire profit de l’avantage que procure internet pour être mobile....

Fermer