Passer au contenu

URL canonique et optimisation du référencement

Je ne suis pas un spécialiste de la science complexe et mouvante du référencement mais cette discipline connexe du webdesign me passionne de plus en plus.J’ai…

Je ne suis pas un spécialiste de la science complexe et mouvante du référencement mais cette discipline connexe du webdesign me passionne de plus en plus.
J’ai à ce titre découvert récemment la notion d’URL canonique et URL dupliquée, et surtout en quoi la présence de celles-ci pouvaient s’avérer néfastes à un bon référencement dans les moteurs de recherche.
Vous n’avez peut-être pas remarqué mais la configuration par défaut de vos serveurs d’hébergement rend la plupart du temps votre site accessible sous deux adresses, l’une avec le www. devant le nom et l’autre sans, soit http://www.votresite.com et http://votresite.com, le www étant en fait un sous-domaine de la racine principale de votre site.
Cette situation peut poser problème pour deux raisons : d’une part le contenu dupliqué de vos pages est "dilué" et votre pagerank en sera affecté (deux pages sur lesquelles se répartissent les visites pèsent moins lourd qu’une seule), d’autre part Google peut considérer ce double accès comme du contenu dupliqué, et le traiter comme du spam-indexing.
L’URL canonique (qui correspond aux normes et règles en vigueur) est l’URL commençant par www. et vous avez donc tout intérêt à supprimer l’accès à votre site sans le www.
Pour cela, à savoir orcer le sous-domaine www (et interdire l’indexation du site sans ce sous-domaine), il existe une solution assez simple si vous avez accès au fichier .htaccess de votre serveur d’hébergement (ou si vous pouvez en créer un) : ajoutez dans celui-ci le bout de code suivant :

Pour forcer le sous-domaine www (et interdire l’indexation du site sans ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com/$1 [QSA,R=301,L]

Selon les cas, vous devrez peut-être retirer le / à la fin du domaine, comme ceci :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]

Si vous voulez à l’inverse supprimer le sous-domaine www (et interdire l’indexation du site avec ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]


Attention cependant aux cas particuliers, notamment si vous avez des sous-domaines autres que www. Vérifiez également bien dans vos fichiers de configuration que la racine de votre site est bien indiquée avec les www.

Pour info j’ai appliqué dernièrement cette règle à Presse-citron et je vais l’étendre à tous les sites dont j’ai la responsabilité.
S’il y a des experts parmi vous, peut-être pourront-ils nous indiquer si cette méthode (décrite et commentée sur Webankinfo) est correcte est s’il n’y a pas de contre-indication ?

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera
13 commentaires
13 commentaires
  1. Le risque de se faire pénaliser pour spamdexing quand on laisse le site accessible avec ou sans "www" est quasi-nul sur Google (pour ne pas dire nul).

    D’autre part, il est tout à fait possible d’avoir un contenu différent sur example.com et http://www.example.com ! et faire de ces deux URLs deux sites tout à fait distincts.

    Le vrai problème, ce sont les sites accessibles via l’URL avec le "www" et inaccessibles quand on tape l’URL sans "www". Ou inversement.

    Ce qui est dommage, c’est que certains hébergement mutualisés ne permettent pas de faire un choix à ce niveau-là.

  2. Les URLs avec ou sans “www.” ?

    Une petite question me turlupine depuis un bout de temps: les urls avec ou sans www? Avec? Je suis pour le www dans les adresses quand elle sont imprimées: les gens comprennent que http://www.machin.be c’est un site internet, même quand ce texte n&#82…

  3. Merci Eric (et WebRankInfo)!
    Ca ne pouvait que tomber pile-poil !
    J’étais justement en train de me débattre avec l’url rewriting et ça ne marchait pas (un \ oublié avant le .com)
    Dans mon cas, le 1er exemple marche bien.

  4. Attention avec certains hebergements qui proposent par exemple un accès en https si cette règle est en place elle fait alors revenir a chaque fois en mode http.
    Perso je pratique plutôt en faisant pointer mon site sans www vers un repertoire contenant un simple fichier index.php qui lui même fait une redirection permanente vers le www. La redirection permanente étant bien perçue par les moteurs de recherches.

  5. Pour avoir plusieurs adresses web accessibles pointant sur le même site (blog.loupanthere.info + avec ou sans le http://www.loupanthere.info) je puis assurer qu’il n’y a eu quasi aucune incidence sur l’indexation google (exalead, yahoo, msn et les autres) car chaque moteur finit par choisir l’url qu’il va indexer. Mais en le précisant aux moteurs (via google webmaster par ex, adresse plus haut) on accelère un peu le mouvement. Sans plus. Donc pas de panique.

  6. Article intéressant mais apparemment ils ont dû résoudre le truc chez google pour éviter l’éparpillement du Pagerank… Je viens de faire le test et j’ai exactement le même pagerank avec et sans “www.” alors que je référencie uniquement la version avec “www.”… Donc du coup si pas éparpillement du PR, pas nécessité selon moi de fermer la version sans “www.”

  7. L’url rewriting est toujours la meilleur solution car avec des pages de page.php?id=12 cela peut poser un sérieux problème avec l’url canonique.
    J’essayais la balise et ça était un cauchemar pour moi.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *