Je ne suis pas un spécialiste de la science complexe et mouvante du référencement mais cette discipline connexe du webdesign me passionne de plus en plus.
J’ai à ce titre découvert récemment la notion d’URL canonique et URL dupliquée, et surtout en quoi la présence de celles-ci pouvaient s’avérer néfastes à un bon référencement dans les moteurs de recherche.
Vous n’avez peut-être pas remarqué mais la configuration par défaut de vos serveurs d’hébergement rend la plupart du temps votre site accessible sous deux adresses, l’une avec le www. devant le nom et l’autre sans, soit http://www.votresite.com et http://votresite.com, le www étant en fait un sous-domaine de la racine principale de votre site.
Cette situation peut poser problème pour deux raisons : d’une part le contenu dupliqué de vos pages est "dilué" et votre pagerank en sera affecté (deux pages sur lesquelles se répartissent les visites pèsent moins lourd qu’une seule), d’autre part Google peut considérer ce double accès comme du contenu dupliqué, et le traiter comme du spam-indexing.
L’URL canonique (qui correspond aux normes et règles en vigueur) est l’URL commençant par www. et vous avez donc tout intérêt à supprimer l’accès à votre site sans le www.
Pour cela, à savoir orcer le sous-domaine www (et interdire l’indexation du site sans ce sous-domaine), il existe une solution assez simple si vous avez accès au fichier .htaccess de votre serveur d’hébergement (ou si vous pouvez en créer un) : ajoutez dans celui-ci le bout de code suivant :
Pour forcer le sous-domaine www (et interdire l’indexation du site sans ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com/$1 [QSA,R=301,L]
Selon les cas, vous devrez peut-être retirer le / à la fin du domaine, comme ceci :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]
Si vous voulez à l’inverse supprimer le sous-domaine www (et interdire l’indexation du site avec ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]
Attention cependant aux cas particuliers, notamment si vous avez des sous-domaines autres que www. Vérifiez également bien dans vos fichiers de configuration que la racine de votre site est bien indiquée avec les www.
Pour info j’ai appliqué dernièrement cette règle à Presse-citron et je vais l’étendre à tous les sites dont j’ai la responsabilité.
S’il y a des experts parmi vous, peut-être pourront-ils nous indiquer si cette méthode (décrite et commentée sur Webankinfo) est correcte est s’il n’y a pas de contre-indication ?
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
C’est ceux de no-www.org/ qui vont être content ^^
Pour ce qui est de Google, il y des outils (webmaster tools) qui permettent de lui indiquer le domaine favori à indexer ( avec ou sans le www)
http://www.google.com/support/we...
sur le même sujet de sous-domaines et de prefixes www inutiles, je vous conseille l’article en.wikipedia.org/wiki/No-…
en gros ça dit que le sous-domaine www fait double emploi avec le http:// (ils spécifient tous les deux qu’on veut accéder à du contenu hypertexte)
les sous-domaines pouvant servir à spécifier un contenu précis (en.wikipedia.org) ou simplement à faire joli (welove.ff017d.com)
Le risque de se faire pénaliser pour spamdexing quand on laisse le site accessible avec ou sans "www" est quasi-nul sur Google (pour ne pas dire nul).
D’autre part, il est tout à fait possible d’avoir un contenu différent sur example.com et http://www.example.com ! et faire de ces deux URLs deux sites tout à fait distincts.
Le vrai problème, ce sont les sites accessibles via l’URL avec le "www" et inaccessibles quand on tape l’URL sans "www". Ou inversement.
Ce qui est dommage, c’est que certains hébergement mutualisés ne permettent pas de faire un choix à ce niveau-là.
après tests sur mon site, ça ne semble pas compatible avec mon rewriting d’URL…
Les URLs avec ou sans “www.” ?
Une petite question me turlupine depuis un bout de temps: les urls avec ou sans www? Avec? Je suis pour le www dans les adresses quand elle sont imprimées: les gens comprennent que http://www.machin.be c’est un site internet, même quand ce texte nR…
Ca a pourtant l’air de très bien marcher sur ton site en signature…
Merci Eric (et WebRankInfo)!
Ca ne pouvait que tomber pile-poil !
J’étais justement en train de me débattre avec l’url rewriting et ça ne marchait pas (un \ oublié avant le .com)
Dans mon cas, le 1er exemple marche bien.
Attention avec certains hebergements qui proposent par exemple un accès en https si cette règle est en place elle fait alors revenir a chaque fois en mode http.
Perso je pratique plutôt en faisant pointer mon site sans www vers un repertoire contenant un simple fichier index.php qui lui même fait une redirection permanente vers le www. La redirection permanente étant bien perçue par les moteurs de recherches.
Pour avoir plusieurs adresses web accessibles pointant sur le même site (blog.loupanthere.info + avec ou sans le http://www.loupanthere.info) je puis assurer qu’il n’y a eu quasi aucune incidence sur l’indexation google (exalead, yahoo, msn et les autres) car chaque moteur finit par choisir l’url qu’il va indexer. Mais en le précisant aux moteurs (via google webmaster par ex, adresse plus haut) on accelère un peu le mouvement. Sans plus. Donc pas de panique.
Merci à 2ric pour l’url rewriting.
le cerveau chaufe !
Article intéressant mais apparemment ils ont dû résoudre le truc chez google pour éviter l’éparpillement du Pagerank… Je viens de faire le test et j’ai exactement le même pagerank avec et sans “www.” alors que je référencie uniquement la version avec “www.”… Donc du coup si pas éparpillement du PR, pas nécessité selon moi de fermer la version sans “www.”
L’url rewriting est toujours la meilleur solution car avec des pages de page.php?id=12 cela peut poser un sérieux problème avec l’url canonique.
J’essayais la balise et ça était un cauchemar pour moi.