Je parlais récemment d'un des intérêts induits par le respect des standards du W3C : une meilleure indexation des recherches. L'ami Biz, toujours lui, me challenge sur cette affirmation qui lui semblait dénuée de fondement. Voici donc un point sur le sujet.
Je tiens l'information de la FAQ du Web Standards Project, traduite par mes soins. Je cite :
Se conformer aux standards du Web peut donner aux pages Web une meilleure visibilité dans les moteurs de recherche. L'information structurelle présente dans les documents conformes simplifie l'accès aux informations par les moteurs de recherche et leur analyse par ceux-ci, et permet ainsi une meilleure indexation.
Parce que l'utilisation des standards Web facilite la compréhension de la structure de votre document par des applications aussi bien du coté client que du coté serveur, ajouter un moteur de recherche à votre propre site est plus facile et donne de meilleurs résultats.
Les Standards sont écrits pour que les anciens navigateurs comprennent la structure de base de vos documents. Même s'ils ne comprennent pas les toutes dernières jolies fontionnalités des standards, ils seront capables d'afficher le contenu de votre site. Il en est bien sûr de même pour les robots, ces systèmes qui collectent l'information sur votre site pour les moteurs de recherche.
Je suis tombé depuis sur d'autres articles, qui confirment cela, a commencer par celui d'Evolt.org :faites bon usage des balises HTML dans votre page. Les balises de titres (Ndt :
. Le clou est enfoncé par un dernier article sur Webmasterbase.com :<h1>
à <h6>
) sont un moyen efficace de donner aux moteurs de recherche des indices sur le sujet de votre page
Du point de vue placement dans les moteurs de recherche, se conformer aux standards garantit aussi de meilleurs résultats et une visibilité accrue. Les documents conformes aux standards sont indexés plus précisément grace à la l'information de structure qu'on y trouve, car ils sont facilement accessibles pour évaluation par des machines.
Je terminerais par un dernier exemple, très concret, celui de l'utilisation de lettrines (la première lettre de chaque paragraphe est stylée différement) dans des documents web. Sur le StandBlog, cet effet est réalisé avec une feuille de styles, qui permet l'indexation du premier mot par un moteur de recherche sans souci. A l'inverse, dans 90% des cas, les développeurs web utilisent des artifices pour réaliser les lettrines. Le plus souvent, la première lettre est une image au format GIF, suivit du reste du mot. Si mon paragraphe comment par Standards du Web
, le moteur de recherche indexera [image S.GIF]tandards du Web
, forcément moins pertinent que la même information sous forme de texte pur stylé par des CSS. CQFD !