Autres
critères utilisés par GooglePageRank est-il le seul critère
utilisé par Google? Non ! D'ailleurs s'il n'existait que le PageRank,
Google serait incapable de répondre à une recherche par mots clefs
puique le PageRank n'est qu'une simple valeur numérique. Rappelons encore
une fois que le PageRank attribué par Google traduit l'importance d'une
page web sans tenir compte de son contenu. Ce calcul s'appuie sur le nombre de
liens (et leur poids) qui pointent vers cette page. De fait, en tapant
un mot clef (ou plusieurs) dans Google, vous pouvez obtenir une page de résultats
où la première page proposée n'est pas celle qui a le meilleur
PageRank. Le PageRank n'est donc qu'un des éléments pris en compte
par Google pour afficher les résultats. Quels sont les autres critères
? En fait Google utilise globalement 3 critères : - Le
PageRank
- Le texte d'un lien
- Différents éléments
liés au texte présent dans une page et à son environnement
Le
PageRank Le PageRank a déjà été développé,
c'est un critère "off the page" c'est à dire qui ne tient
pas compte du contenu de la page. Il s'agit du critère le plus difficilement
maîtrisable. Le texte d'un lien Google accorde une importance
certaine (laquelle ? On ne sait pas exactement) au texte qui existe sur un lien.
Voici 3 exemples qui renvoient à la même page :
Google Référencement, un dossier pour
optimiser son référencement sur Google Pour retournez
au sommaire cliquez ici Sommaire du dossier
http://www.google-referencement.fr S'ils
renvoient tous à la même page, il ne sont pas du tout équivalent
pour Google. Le premier est le meilleur car il donne une description
sur le lien (texte en bleu) de la page vers laquelle il pointe. Google y est très
sensible. Concrètement, la page vers laquelle pointe ce lien sera plus
réactive sur les mots du lien ; ici Google. Le deuxième "Cliquez
ici" ne donne aucune indication sur le contenu de la page. Il est tout à
fait neutre. Il ne présente pas d'intérêt. Le troisième
est à mi-chemin. Mais il dépend essentiellement de la façon
dont sont nommés les pages et les dossiers dans le site web. Conclusion,
le nom du fichier html a une importance en référencement (ne pas
confondre avec le titre de la page qui apparaît dans la barre bleu en haut
du navigateur qui a aussi de l'importance mais dans le prochain critère). Cette
importance accordée par Google au texte d'un lien a été utilisée
par certains pour créer une technique appeler "Google bombing".
Elle consiste à "bombarder" Google de liens dont le texte est
un mot clef de façon à améliorer le positionnement d'une
page sur ce mot clef (ou plusieurs). Bombarder signifie ici mettre en place des
liens sur de nombreux sites. Quelques exemples sont déjà célèbres
: - "miserable failure" renvoie par exemple soit sur
le site officiel de la Maison Blanche, soit sur le site de Michael Moore. Il s'agit
d'une bataille via Google bombing interposé pour ou contre le président
américain. http://www.whitehouse.gov/president/gwbbio.html - "député
liberticide" renvoie sur le site du député Jean Dionis coupable
aux yeux de certains d'être rapporteur de la nouvelle loi sur l'économie
numérique. http://www.jeandionis.com - pendant quelques jours
de mars 2004, le mot "magouilleur" renvoyait sur le site de l'Elysée.
Ce n'est plus le cas au moment où j'écris ces lignes (2 avril 2004). http://www.elysee.fr/
Plus
de renseignements dans la page de liens. Autres éléments
liés au texte Ce critère est "in the page" c'est
à dire en rapport avec le contenu de la page et/ou son environnement. Le
webmaster a plus de maîtrise sur cet aspect. Il est important de savoir
que Google fait une copie du code HTML (donc sans images) de toutes les pages
indexées sur ses serveurs c'est ce qui lui permet de vous proposer un lien
"En cache" où on retrouve la version html donc sans contenu multimédia
de la page même si celle ci n'existe plus sur le serveur original (très
pratique). A partir de cette copie Google fait une analyse du contenu :
- nombre de mots,
- position d'un mot dans le document,
- occurences
des mots,
- proximité d'un mot par rapport à un autre,
- taille
de police,
- la casse utilisée,
- balises utilisées
(par exemple H1) ,
- gras,
- etc.
Google
n'aime pas les trop petits caractères (taille de police très petite).
Google pense alors qu'il existe une possibilité qu'on essaie de le tromper.
Même chose si Google découvre des mots de couleur blanche sur un
fond blanc. Ces mots sont invisibles pour l'internaute mais pas pour un robot
de moteur. Il s'agissait d'une technique destinée à ajouter de nombreux
mots clés dans le texte pour tromper, c'est une technique complètement
dépassée qui peut avoir pour conséquence d'écarter
la page destinée à être référencée de
l'index d'un moteur. Google analyse également le contenu des pages
web voisines (reliées directement par un lien). Si Google y retrouve les
mêmes mots clefs, Google estimera que ces pages forment un ensemble cohérent
autour d'un sujet ou d'un thème. L'ancienneté
(SandBox) Il semble bien que d'une manière ou d'une autre, l'ancienneté
du site dans l'index de Google ait une importance. Depuis fin 2004, on parle même
beaucoup dans les forums consacrés à Google d'une Sandbox (bac à
sable). Cette Sandbox serait un espace où serait placé de façon
provisoire les sites entrants dans l'index. Elle serait destinée à
s'assurer (pour Google) du sérieux du site. Par exemple, un site utilisant
un référencement automatique créant quelques centaines de
backlinks en une journée pourrait sembler suspect. Attention, cette Sandbox
n'empêche pas l'indexation d'un site ou des pages d'un site dans Google.
Par contre, elle ralentit la réactivité de pages par rapport à
des mots clefs. Leur positionnement est donc médiocre. [haut]
[index Google référencement] [suite]
|