COMMENT FAIRE POUR QUE VOS PAGES PHP SOIENT INDEXÉES SUR GOOGLE

COMMENT FAIRE POUR QUE VOS PAGES PHP SOIENT INDEXÉES SUR GOOGLE

Partie 1 de la série SEO for PHP

Enfin, un article qui expliquera le problème et répondra à la question qui laisse perplexe et échappe aux développeurs web et aux experts en SEO depuis des années. La question : Comment faire pour que mes pages PHP soient indexées sur Google et d’autres moteurs de recherche ?

Le mythe exposé

Tout d’abord, je dois souligner qu’il y a toujours eu un mythe autour de l’indexation (ou de la non-indexation) par Google des pages PHP, en particulier des pages générées dynamiquement. Je suppose que le titre mystérieux de cette entrée n’arrange pas les choses, car Google est facilement capable d’indexer à la fois les pages PHP générées dynamiquement et les pages PHP dont le contenu est généré dynamiquement (lire plus bas pour une explication). Il existe quelques bonnes pratiques que les webmasters devraient suivre pour s’assurer que les pages de leur site sont clairement lisibles, mais il n’y a pas vraiment de grand mystère. Je vous expliquerai dans les prochains articles de cette série comment préparer votre site PHP pour Google. En attendant, Google (comme toujours) est assez intelligent pour trier la plupart des déchets que les gens postent parfois sur le web. Alors pourquoi écrire un article sur ce sujet ? Parce qu’il y a tellement de gens qui croient encore à ce mythe, et il est temps que quelqu’un fasse remarquer que Google a déjà remis les pendules à l’heure.

Il est facile de voir comment un tel mythe pourrait se perpétuer dans le temps. En 2006, Google a publié un extrait de son Guide du webmaster qui disait que Google avait plus de mal à indexer les pages dont l’URL comportait une chaîne de requête (pour ceux qui ne connaissent pas les parties d’URL, lisez cette entrée de Matt Cutts de Google). Google a déjà mis en garde :

« N’utilisez pas « &id= » comme paramètre dans vos URL, car nous n’incluons pas ces pages dans notre index ».

Ah ha ! L’étincelle qui a allumé le feu. Donc, Google a vraiment eu du mal à un moment donné à indexer les pages PHP ? Eh bien, pas si vite M. ou Mme Webmaster pantalon. Ils n’ont rien dit sur les pages générées dynamiquement, ni même sur le PHP d’ailleurs. Ils ont simplement dit qu’il est préférable de ne pas utiliser certaines chaînes de requête dans vos URL. Cette idée a été exagérée et élargie au fil des ans pour inclure en quelque sorte l’idée que Google est totalement incapable d’indexer les pages traitées par PHP. Cette notion était fausse à l’époque, et l’est encore aujourd’hui. En fait, Google a même supprimé cette ligne du Guide du webmaster et a clairement indiqué qu’il n’y avait pas de problème à générer des pages de manière dynamique.

Les personnes qui croient encore que PHP ne peut pas être indexé par Google n’ont évidemment jamais effectué cette requête :

inurl : .php

Quoi ? C’est un scandale ! Google n’indexe pas les pages PHP ! Surtout pas la première qui est générée dynamiquement et qui contient « ?id= » dans la chaîne de requête ! Bon, maintenant je vais enlever ma langue de ma joue pour pouvoir finir.

Une explication technique

Très bien, c’est là qu’il faut être un peu plus technique. N’ayez pas peur, ce n’est pas trop grave. Après tout, ce sont les gens qui n’étaient pas prêts à explorer un peu les trucs techniques qui ont perpétué ce mythe en premier lieu. Faites partie de la solution et continuez à lire !

Tout d’abord, il y a une réelle différence entre les pages générées dynamiquement et les pages dont le contenu est généré dynamiquement. Il arrive souvent que les pages générées dynamiquement aient également un contenu généré dynamiquement, mais toutes les pages avec un contenu généré dynamiquement ne doivent pas nécessairement être elles-mêmes générées dynamiquement. Vous êtes confus ? Laissez-moi vous expliquer.

Pages avec contenu dynamique

Disons que j’ai un fichier appelé faqs.php qui occupe en fait de la mémoire sur mon serveur, et qui contient du code PHP qui remplit une certaine fonction. Le code accède peut-être à une base de données, obtient une liste de FAQ et les imprime à l’écran. C’est un exemple de page non générée dynamiquement qui génère du contenu de manière dynamique. Dans ce cas, le script faqs.php ne fera que fournir systématiquement des FAQ à l’utilisateur. Il n’affichera probablement jamais les conditions d’utilisation, le contact ou la page d’information. C’est pour les FAQ.

Google n’a jamais eu de problème pour indexer ce type de pages, même si elles sont créées en PHP. Le fait que le PHP soit impliqué est un point discutable car tout le contenu a été livré au navigateur ou au moteur de recherche après que le contenu ait été compilé ensemble sur le serveur. Les araignées ne se soucient pas de ce qui se passe en coulisses pour livrer ma page, surtout lorsque j’ai cette simple URL : http://www.mysite.com/faqs.php. À toutes fins utiles, cette page est exactement la même qu’une page HTML statique livrée par le serveur à l’araignée ou au navigateur (la seule différence est l’extension .php dans le nom du fichier). Même l’extension du fichier ne pose pas de problème, étant donné qu’un webmaster peut configurer Apache pour qu’il exécute et fournisse des pages PHP avec l’extension .html, ce qui masquerait totalement le fait que le contenu de la page a été fourni de manière dynamique.

Pages générées dynamiquement

Maintenant, imaginons que j’ai un fichier appelé index.php, et qu’une chaîne de requête y est annexée de sorte qu’il ressemble à ceci : index.php?page=faqs. Ce script pourrait produire ce que les gens appelleraient une page générée dynamiquement. Dans ce cas également, il fournit du contenu à l’écran, en affichant également des informations sur les FAQ, tout comme dans notre exemple précédent. La différence avec cette page index.php est qu’elle n’est probablement pas spécifique aux seules FAQ. Elle est probablement aussi utilisée pour fournir les conditions d’utilisation, les contacts et les informations sur les pages respectivement. En théorie (mais pas en bonne pratique), vous pourriez avoir un site web entier de milliers de pages qui proviennent d’un seul script PHP.

Ce sont les types de pages dont Google a mis en garde dans le passé. Bien qu’ils n’aient jamais eu de problèmes avec les types de pages décrits précédemment, vous pouvez voir comment Google a pu avoir des difficultés dans le passé, ou a simplement refusé de suivre et d’indexer ces types de pages, surtout si plusieurs paires de valeurs de noms existent dans la chaîne de requête.

Réponses courtes et simples

OK, vous avez peut-être la tête qui tourne après tout ce charabia. Voyons comment Google lui-même répond à la question : « Est-ce que Google indexe les pages dynamiques ? » La réponse courte et simple est oui.

Eh bien, regardez-moi ça ! Google lui-même a mis les choses au clair une fois pour toutes. Je n’aime pas nécessairement leur suggestion de créer des pages statiques avec le même contenu que vos pages dynamiques (si c’était une option, il y aurait peu de raisons d’utiliser des pages dynamiques au départ). Quoi qu’il en soit, Google dit essentiellement à tous les webmasters délirants et farfelus qui ont des URL tout aussi farfelus : « Allez-y, faites-en des pages dynamiques ! Nous rassemblerons et rassemblerons votre contenu gratuitement ».

Google a donc rattrapé le Wild Wild Web à cet égard, et ce au moment même où une nouvelle frontière émerge. Il s’agit d’un site et de pages PHP faciles à indexer. Des pages et un contenu dynamiques qui restent la base, mais avec une nouvelle dimension favorable au 2.0. Revenez bientôt pour lire le prochain article, dans lequel j’expliquerai comment créer un site PHP simple qui met en œuvre certaines de ces nouveautés et utilise certaines suggestions de Google Webmaster Central.