Optimiser l’indexation de votre site et de vos pages dans Google

Dans cet article je vais vous expliquer comment indexer votre site et vos pages dans Google puis dans un second temps vous présenter les outils qui peuvent vous être utiles pour accélérer l’indexation de vos pages.

1/ Indexation automatique et soumettre son site

a/ Comment savoir si votre site est déjà présent dans Google? La commande “site:”

Par défaut Google indexe quasiment toutes pages auxquelles son robot a accès*.  Il se peut donc que votre site soit déjà référencé. Pour vérifier si votre site est déjà présent dans l’index de Google, c’est facile, rendez-vous sur google.fr et tapez simplement la commande “site:” suivi de votre nom de domaine. Cela donne: “site:www.votrenomdedomaine.com”

Exemple:

site:www.gagnerargent.com

Google liste toutes (ou presque) les URLs de votre site qui sont indexées dans son moteur.

Vous pouvez également utiliser cette commande pour vérifie si une URL en particulier est indexée, voici un exemple avec cette page:

site:http://www.gagnerargent.com/referencement/indexation-dans-google-576.html

De même la commande “site” pour un répertoire de votre site, listera toutes les URLs de ce répertoire que Google a indexé, voici un exemple:

site:http://www.gagnerargent.com/referencement/

La commande “site:” est un bon outil pour contrôler votre indexation, il est ainsi facile de faire le tour de ce qui est indexé. Bien entendu pour un site de plusieurs milliers de pages, cela va être un peu long, mais en contrôlant répertoire par répertoire cela peut tout de même faire ressortir de bonnes informations.

b/ Soumettre un site dans Google

Si la commande site renvoie vers: “Aucun document ne correspond aux termes de recherche spécifiés”. Votre site n’est pas encore présent dans l’index de Google, pour accélérer l’indexation vous pouvez le soumettre via la page suivante: http://www.google.fr/addurl/ (notez que si votre site est accessible aux moteurs il sera indexé tôt ou tard même si vous ne le proposez pas).

Conseil: ne proposer pas votre site tant qu’il est en construction. Attendez au moins d’être sûr que vos URLs ne changeront pas. Tant qu’il est en construction bloquez l’accès à votre site avec un fichier HTACCESS pour vous s’assurer qu’il ne sera pas indexé. Je reviendrai dans un autre article sur comment bloquer son site aux moteurs de recherche ou supprimer des pages de l’index de Google.

c/ Les outils pour webmasters

Si vous n’avez pas encore de compte Google, il est maintenant temps de créer un compte google et d’utiliser les outils pour webmasters aussi appelés “Google webmaster tools” (abréviation:“GWT”).

d/ Si vous rencontrez des problèmes pour indexer votre site voici des sources fréquentes de problèmes d’indexation:

  • un contenu trop faible, site de type “Made for Adsense” (abréviation: “MFA”), très peu de contenu et beaucoup de publicité
  • votre domaine est en parking Google n’indexe pas ou plutôt “désindexe” les pages parking
  • votre nom de domaine a peut être été black listé précédemment, vous pouvez alors utiliser une demande de réexamen via les outils pour webmasters de Google
  • Le contenu de votre site est déjà présent dans l’index de Google, on parle de “Duplicate Content” (abréviation: “DC”). C’est rarement la source de problème d’indexation. Mais si des pages de votre site sont désindexées de Google, cela pourrait être la source du problème. Nous reviendrons sur le contenu dupliqué dans un prochain article

2/ Comment indexer (plus) rapidement ses pages?

Les articles de certains sites sont indexés plus rapidement que d’autres. Vous vous demandez peut être pourquoi dès que votre concurrent poste un article, il apparait dans les résultats de Google dans les minutes qui suivent sa publication. L’explication est simple, plus un site est mis à jour, plus souvent Google le visitera. Si chaque fois que Google vient sur votre site il s’aperçoit que le contenu a été mis à jour, il le visitera d’autant plus souvent pour que son index soit le plus à jour possible.

a/ Une bonne structure de site et des pages accessibles

Comme je le disais au début cet article? Google indexe automatiquement les pages auxquelles il a accès. Pour indexer vos articles ceux-ci doivent être accessibles facilement via des liens présents sur des pages régulièrement visitées par les robots. Prenons un exemple, votre dernier article n’est accessible que dans un catégorie de votre blog, que Googlebot ne visite qu’une fois par semaine et il est passé juste avant la publication de ce dernier article. Vous allez devoir attendre une semaine avant que Googlebot ne puisse accéder et ainsi indexer votre article. Tandis que si votre article est accessible via votre page d’accueil qui est visitée une fois par jour par Googlebot vous n’aurez sans doute pas besoin d’attendre plus de 24h avant qu’il ne soit indexé.

b/ Le plan du site

Le plan du site est un outil très utile pour une bonne indexation de vos pages. Dans le premier Ebook sur le référencement que j’ai lu en 2005 “Comment être N°1 sur Google”. Le plan du site était déjà mentionné, c’est une valeur sûre pour votre référencement. Le plan du site est une page qui présente toutes les catégories de votre site, ainsi que tous les articles. Une fois créé faites un lien vers cette page à partir de toutes les pages de votre site (dans le pied de page par exemple). Le plan du site permettra aux robots d’accéder facilement à des pages qui ne sont pas forcement faciles d’accès.

Attention: si votre plan du site doit contenir plusieurs centaines de pages, voir milliers de pages, découpez-le en plusieurs plans de site.

c/ Le sitemap.xml

Si vous m’avez écouté, je vous disais plus haut de créer un compte Google et d’utiliser “les outils pour webmasters” pour votre site. Si cela est fait rendez-vous dans votre compte Google ensuite dans les outils pour webmasters, sélectionner le site en question puis dans “Configuration du site” vous pourrez cliquer sur “Sitemaps” puis “Envoyez un sitemap”. Le sitemap comme accélèrera considérablement l’indexation de vos articles.  Vous pouvez consulter cette page pour plus de détails sur la création et l’envoi de fichier sitemap.

*Le robot de google est appelé “GoogleBot”. Il parcoure le web de pages en pages, de sites en sites en passant par les liens. On dit qu’il “crawl”. On parle de robot “crawler”.

Ajouter une réponse