VOUS VOULEZ DONC VOUS CLASSER DANS GOOGLE ?

VOUS VOULEZ DONC VOUS CLASSER DANS GOOGLE ?

Discuter du référencement avec les clients n’est pas une tâche facile, mais il est extrêmement important de les éduquer sur ce qui est nécessaire pour obtenir leur classement afin de fixer les bonnes attentes. Les personnes travaillant dans le domaine du référencement doivent comprendre comment Google et les autres moteurs de recherche explorent, indexent et classent les sites web pour pouvoir éduquer le client en conséquence.

Il est difficile de savoir à quel point il sera difficile d’obtenir un classement dans le cadre d’un nouveau projet d’optimisation pour les moteurs de recherche, car de nombreux facteurs entrent en jeu et Google ajuste constamment son algorithme. En comprenant les moteurs de recherche, vous pouvez aider les clients à comprendre à quel point le travail de référencement est parfois difficile.

Alors comment fonctionne l’algorithme de Google ?

L’anatomie d’un moteur de recherche :

Il s’agit d’une décomposition de base d’un processus beaucoup plus complexe.

Un serveur d’URL envoie des listes d’URL à parcourir.
Les crawlers téléchargent les pages web puis les envoient au serveur de la boutique. Le serveur de stockage compresse et stocke les pages web.
Chaque page web se voit attribuer un numéro d’identification associé appelé docID, puis est envoyée à l’indexeur.
La fonction d’indexation est assurée par l’indexeur et le trieur.
Tous les documents (pages web) sont convertis en un ensemble d’occurrences de mots appelées hits. Chaque hit enregistre le mot, la position dans le document et d’autres variables.
L’indexeur envoie ces occurrences dans un ensemble de « godets », créant ainsi un index partiel.
L’indexeur sépare tous les liens de chaque page web et conserve les informations importantes à leur sujet dans un autre fichier. Ce fichier contient des informations sur le point de départ et d’arrivée de chaque lien, ainsi que le texte du lien.
La base de données des liens est utilisée pour calculer le PageRank de tous les documents. Le trieur prend les barils, qui sont triés par docID…., et les utilise par wordID pour générer l’index inversé…… Le chercheur est géré par un serveur web et utilise l’index inversé et les PageRanks pour répondre aux requêtes.

Les moteurs de recherche utilisent des algorithmes très complexes que peu de gens comprennent vraiment, mais il est tout de même important de savoir comment ils explorent et indexent les pages web. Les bases du crawling et de l’indexation des sites web sont présentées dans le schéma ci-dessous :

 

 

Vous trouverez un processus beaucoup plus approfondi à l’adresse suivante : http://infolab.stanford.edu/~backrub/google.html

En termes simples, c’est ce qui se passe :

Disons que quelqu’un cherche des informations sur les joueurs de blu-ray. Google prend les milliards de documents sur le web et les convertit en wordID. Il recherche ensuite des exemples ou des modèles de wordID dans tous les documents et classe les documents en fonction de la fréquence d’apparition des wordID. Par exemple,

Lecteur Blu-ray

blu 1 4 6 23 37 52 94 134
ray 17 23 66 94 134 176 236 561
joueurs 45 66 134 210 236 371 561 788
Lecteurs de Blu-ray 23 134 561 765 876 1023 1348 1762

 

Le tableau ci-dessus montre que le document 134 apparaît dans tous les documents, ce qui le rend le plus pertinent et le place potentiellement en très bonne position dans les résultats de la recherche. Google doit trier des millions de documents sur le web qui pourraient parler de lunettes Ray-Ban qui sont bleues, de vestes Blue Ray, de maillots Tampa Devil Rays qui sont bleus, de joueurs Devil Ray, de joueurs Blue Apple, etc. En plus de la recherche de wordID, les liens et autres facteurs sur les pages sont pris en considération lors du classement d’un site. Cela devient très vite très complexe.

Clé à emporter : Google doit créer une « association » ou voir que votre site est pertinent pour un mot-clé donné parmi des milliards de documents. La création de cette association peut prendre des mois, voire des années, et elle devient encore plus difficile à mesure que vous vous rapprochez des dix premiers résultats. *Nous savons que Google a environ 200 facteurs de classement, il serait donc bon pour un client de mettre en place autant d’éléments sur la page que possible, afin d’envoyer un message clair à Google sur le sujet de la page, car les éléments sur la page ont tendance à être plus faciles à contrôler que l’aspect de la création de liens.

Connaître le processus de base est une bonne chose, mais quelle quantité d’informations Google doit-il trier pour trouver la page web la plus pertinente pour une requête de recherche ?

Que faut-il pour obtenir une liste de résultats ?
Plus d’un million d’heures de calcul ont été nécessaires à la préparation de l’index de Google
Plus d’un milliard de recherches sont effectuées sur Google chaque jour
Plus de 1 000 années-hommes ont été consacrées au développement de l’algorithme de Google
L’index de la caféine de Google contient plus de 100 millions de gigaoctets
En juillet 2008, Google a traité un billion (1 000 000 000 000) d’URL uniques. Ce qui équivaut à : C’est l’équivalent de « l’exploration complète de chaque intersection de chaque route aux États-Unis ». Sauf que ce serait une carte environ 50 000 fois plus grande que les États-Unis, avec 50 000 fois plus de routes et d’intersections ». Google calcule cela tous les jours.
La base de données des pages indexées de Google est de 5 millions de téraoctets – Une pile de DVD contenant l’index de Google serait aussi haute que 3 192 Empire State buildings.

C’est la tâche d’un SEO, pour essayer d’aider Google à trier efficacement toutes les pages web et ensuite aider un client à se classer pour une certaine requête de recherche. C’est pourquoi il faut du temps pour se classer potentiellement pour un mot-clé donné. Au fur et à mesure que le SEO optimise les pages et crée des liens, Google trie chaque jour une énorme quantité de données afin de mieux comprendre quelles pages devraient se classer dans les premières places.

Comme vous pouvez le constater, Google a consacré beaucoup de temps et d’énergie pour fournir des résultats pertinents aux utilisateurs. Et cela ne s’arrête pas là. Comme de nouvelles pages web sont créées chaque jour, Google doit se tenir au courant de toutes ces nouvelles informations. C’est pourquoi Google et les autres moteurs de recherche doivent être efficaces et performants dans la gestion de toutes ces informations.

Google est en constante évolution

Même si un client a tout en place et est capable d’accéder à la première page des résultats de recherche, Google change et modifie constamment son algorithme, ce qui rend la bataille difficile.

Google a apporté plus de 500 modifications à son algorithme l’année dernière, a déclaré Matt Cutts,

Dans l’ensemble, nous continuons à conseiller aux éditeurs de s’efforcer d’offrir la meilleure expérience utilisateur possible sur leurs sites web……. Ce changement n’est que l’une des 500 améliorations que nous prévoyons d’apporter à la recherche cette année.

La nouvelle est tombée le 19 janvier dernier lorsque Google a annoncé un autre changement d’algorithme.

Bien que la majorité de ces changements soient mineurs, un certain nombre de changements importants ont eu lieu l’année dernière et ont affecté près de 50 % de toutes les requêtes de recherche.

Pour un calendrier actualisé des changements apportés par Google au fil des ans, consultez le site SEOmoz.org. Comme Google change constamment sa façon de classer les sites, le travail de référencement est d’autant plus difficile. Se tenir au courant des derniers changements et de l’actualité du secteur est une tâche sans fin pour un référencement.

Il est évident qu’il y a beaucoup plus de facteurs à prendre en compte dans une campagne de référencement, mais j’ai découvert qu’aider les clients à reconnaître le travail qu’il faut faire pour que les sites soient classés peut améliorer la relation globale de manière positive.

Les statistiques ci-dessus peuvent être consultées à l’adresse suivante :

http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html

http://www.google.com/insidesearch/underthehood.html

http://adam-thompson.me/2011/02/03/google-how-big/