Connect with us
Bouygues

Internet

URL canonique et optimisation du référencement

Il y a

le

Je ne suis pas un spécialiste de la science complexe et mouvante du référencement mais cette discipline connexe du webdesign me passionne de plus en plus.
J’ai à ce titre découvert récemment la notion d’URL canonique et URL dupliquée, et surtout en quoi la présence de celles-ci pouvaient s’avérer néfastes à un bon référencement dans les moteurs de recherche.
Vous n’avez peut-être pas remarqué mais la configuration par défaut de vos serveurs d’hébergement rend la plupart du temps votre site accessible sous deux adresses, l’une avec le www. devant le nom et l’autre sans, soit http://www.votresite.com et http://votresite.com, le www étant en fait un sous-domaine de la racine principale de votre site.
Cette situation peut poser problème pour deux raisons : d’une part le contenu dupliqué de vos pages est "dilué" et votre pagerank en sera affecté (deux pages sur lesquelles se répartissent les visites pèsent moins lourd qu’une seule), d’autre part Google peut considérer ce double accès comme du contenu dupliqué, et le traiter comme du spam-indexing.
L’URL canonique (qui correspond aux normes et règles en vigueur) est l’URL commençant par www. et vous avez donc tout intérêt à supprimer l’accès à votre site sans le www.
Pour cela, à savoir orcer le sous-domaine www (et interdire l’indexation du site sans ce sous-domaine), il existe une solution assez simple si vous avez accès au fichier .htaccess de votre serveur d’hébergement (ou si vous pouvez en créer un) : ajoutez dans celui-ci le bout de code suivant :

Pour forcer le sous-domaine www (et interdire l’indexation du site sans ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com/$1 [QSA,R=301,L]

Selon les cas, vous devrez peut-être retirer le / à la fin du domaine, comme ceci :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]

Si vous voulez à l’inverse supprimer le sous-domaine www (et interdire l’indexation du site avec ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]


Attention cependant aux cas particuliers, notamment si vous avez des sous-domaines autres que www. Vérifiez également bien dans vos fichiers de configuration que la racine de votre site est bien indiquée avec les www.

Pour info j’ai appliqué dernièrement cette règle à Presse-citron et je vais l’étendre à tous les sites dont j’ai la responsabilité.
S’il y a des experts parmi vous, peut-être pourront-ils nous indiquer si cette méthode (décrite et commentée sur Webankinfo) est correcte est s’il n’y a pas de contre-indication ?

13 Commentaires

13 Commentaires

  1. Pym

    29 novembre 2006 at 17 h 56 min

    C’est ceux de no-www.org/ qui vont être content ^^

  2. jLouis

    29 novembre 2006 at 18 h 11 min

    Pour ce qui est de Google, il y des outils (webmaster tools) qui permettent de lui indiquer le domaine favori à indexer ( avec ou sans le www)

    http://www.google.com/support/we...

  3. olivM

    29 novembre 2006 at 18 h 11 min

    sur le même sujet de sous-domaines et de prefixes www inutiles, je vous conseille l’article en.wikipedia.org/wiki/No-…

    en gros ça dit que le sous-domaine www fait double emploi avec le http:// (ils spécifient tous les deux qu’on veut accéder à du contenu hypertexte)

    les sous-domaines pouvant servir à spécifier un contenu précis (en.wikipedia.org) ou simplement à faire joli (welove.ff017d.com)

  4. effisk

    29 novembre 2006 at 19 h 36 min

    Le risque de se faire pénaliser pour spamdexing quand on laisse le site accessible avec ou sans "www" est quasi-nul sur Google (pour ne pas dire nul).

    D’autre part, il est tout à fait possible d’avoir un contenu différent sur example.com et http://www.example.com ! et faire de ces deux URLs deux sites tout à fait distincts.

    Le vrai problème, ce sont les sites accessibles via l’URL avec le "www" et inaccessibles quand on tape l’URL sans "www". Ou inversement.

    Ce qui est dommage, c’est que certains hébergement mutualisés ne permettent pas de faire un choix à ce niveau-là.

  5. eiffel

    29 novembre 2006 at 20 h 07 min

    après tests sur mon site, ça ne semble pas compatible avec mon rewriting d’URL…

  6. Gatellier.be

    30 novembre 2006 at 13 h 46 min

    Les URLs avec ou sans “www.” ?

    Une petite question me turlupine depuis un bout de temps: les urls avec ou sans www? Avec? Je suis pour le www dans les adresses quand elle sont imprimées: les gens comprennent que http://www.machin.be c’est un site internet, même quand ce texte n&#82…

  7. le SurfBlog

    30 novembre 2006 at 15 h 35 min

    Ca a pourtant l’air de très bien marcher sur ton site en signature…

  8. Globulvert

    30 novembre 2006 at 16 h 48 min

    Merci Eric (et WebRankInfo)!
    Ca ne pouvait que tomber pile-poil !
    J’étais justement en train de me débattre avec l’url rewriting et ça ne marchait pas (un \ oublié avant le .com)
    Dans mon cas, le 1er exemple marche bien.

  9. Francis

    30 novembre 2006 at 17 h 22 min

    Attention avec certains hebergements qui proposent par exemple un accès en https si cette règle est en place elle fait alors revenir a chaque fois en mode http.
    Perso je pratique plutôt en faisant pointer mon site sans www vers un repertoire contenant un simple fichier index.php qui lui même fait une redirection permanente vers le www. La redirection permanente étant bien perçue par les moteurs de recherches.

  10. loupanthère

    5 décembre 2006 at 15 h 19 min

    Pour avoir plusieurs adresses web accessibles pointant sur le même site (blog.loupanthere.info + avec ou sans le http://www.loupanthere.info) je puis assurer qu’il n’y a eu quasi aucune incidence sur l’indexation google (exalead, yahoo, msn et les autres) car chaque moteur finit par choisir l’url qu’il va indexer. Mais en le précisant aux moteurs (via google webmaster par ex, adresse plus haut) on accelère un peu le mouvement. Sans plus. Donc pas de panique.

  11. Tom Miller

    4 mars 2008 at 12 h 43 min

    Merci à 2ric pour l’url rewriting.
    le cerveau chaufe !

  12. ambassades

    20 février 2009 at 21 h 45 min

    Article intéressant mais apparemment ils ont dû résoudre le truc chez google pour éviter l’éparpillement du Pagerank… Je viens de faire le test et j’ai exactement le même pagerank avec et sans « www. » alors que je référencie uniquement la version avec « www. »… Donc du coup si pas éparpillement du PR, pas nécessité selon moi de fermer la version sans « www. »

  13. Said Mohamed

    23 septembre 2012 at 7 h 45 min

    L’url rewriting est toujours la meilleur solution car avec des pages de page.php?id=12 cela peut poser un sérieux problème avec l’url canonique.
    J’essayais la balise et ça était un cauchemar pour moi.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Dernières news

Les bons plans

Les tests