Qu’est-ce que le PageRank ?

Mercredi 1 octobre 2008

Qu’est ce que le Pagerank© ?

Dans le présent article, nous traiterons de la notion de PageRank, de sa définition et de son importance pour améliorer votre position dans le moteur de recherche Google©.

Le site Google© donne la définition suivante de ce qu’est le PageRank

PageRank :

Fonctionnalité Google qui permet de déterminer le classement d’un site dans nos résultats de recherche. Le classement PageRank repose sur la nature exclusivement démocratique du Web et utilise son importante structure de liens comme indicateur de la valeur des pages. Les sites de grande qualité bénéficient d’un classement PageRank plus élevé, ce dont Google se souvient à chaque fois qu’il effectue une recherche. Google combine le classement PageRank et des techniques perfectionnées de mise en correspondance du texte pour afficher des pages intéressantes, en rapport avec les termes recherchés.

Wikipédia, l’encyclopédie libre, propose quant à lui les explications suivantes :

Le PageRank ou PR est le système de classement des pages Web utilisé par le moteur de recherche Google pour attribuer l’ordre des liens dans les résultats de recherche. Le mot PageRank fait aussi référence à Larry Page cofondateur de Google et inventeur de ce principe. Ce mot est une marque déposée.

Fonctionnement

Google affecte un score à chaque page Web. Cette note est attribuée en fonction de nombreux critères et principalement en fonction des liens externes (popularité de liens) pointant vers la page web, ainsi que des liens que cette dernière fait vers elle-même (liens internes).

L’algorithme du PageRank basé sur les liens était à l’origine le moyen utilisé par Google pour donner une note aux pages. Mais, comme cela est décrit dans le brevet [1]déposé le 17 avril 2007, de nombreux autres critères sont maintenant pris en compte. Aussi, la valeur du PageRank n’offre désormais qu’une indication peu significative sur son importance.

Le PageRank réel d’une page n’est connu que de Google, même si l’on peut penser qu’il suit les principes du brevet. Les internautes peuvent obtenir une approximation du classement de la page en consultant la zone PageRank de la Google Toolbar, qui indique sa valeur sur une échelle de 0 à 10 (Échelle logarithmique). Il existe aussi de nombreux outils pour l’obtenir sans afficher la toolbar.

La course aux liens

Les référenceurs et les webmestres créent quelquefois massivement des liens retour, par échanges de liens ou en inscrivant un site sur une quantité d’annuaires. Google avait autrefois une vision quantitative de la popularité d’une page, cette technique permettait donc de gonfler artificiellement son indice de popularité. Mais Google a réagi : d’une part en instaurant des filtres, tels que la Sandbox. Il détecte et sanctionne les campagnes massives de liens artificiels ; par ailleurs il intègre des critères qualitatifs à l’analyse des liens (sémantique, confiance : indice TrustRank, comportement des utilisateurs).

Principaux critères du score d’une page

Selon le brevet Google, ces critères sont :

 

  • les liens entrants et sortants ;
  • les ancres ;
  • le trafic associé à la page ;
  • le comportement de lecteurs : le choix de la page dans les résultats ;
  • le nom de domaine ;
  • l’hébergement.

Quelques exemples d’ici et d’ailleurs

À titre d’exemple, un site excessivement connu et très populaire aura une cote de 10 : exemple, le site de Google lui-même, Adobe, The White House, (La maison Blanche), de même que le site de la NASA. Les sites ayant une cote de 10 sont excessivement rare.

Le moteur de recherche de Yahoo, les sites de nouvelles en ligne, comme la BBC ou CNN et le journal New York Times ont une cote de 9. Il en est de même pour les sites de Ebay et Youtube. Les sites MySpace et FaceBook ont une cote de 8.

Au Québec, à titre d’exemple, le site du Journal La Presse et de ses groupes affiliés (http://www.cyberpresse.ca/) a un PageRank de 7. Le répertoire de site web La Toile (http://www.toile.com/) a un PageRank de 6, de même que le Journal Le Devoir (http://www.ledevoir.com/) . Le site des annonces classées Les Pac (http://www.lespac.com/) a un PageRank de 5, de même que le portail de Canoe francophone.

À l’opposé, un site très peu connu aura une cote entre 0 et 2. C’est malheureusement là que se retrouve la majorité des sites web sur le Net.

Conséquemment, n’allez surtout pas croire qu’il est un jeu d’enfant d’hisser votre site à un PageRank entre 7 et 9, voir même 10 !

Le PageRank de Google est ni plus ni moins votre cote de popularité sur le web. Plus votre cote de popularité est élevée, plus Google affichera votre site dans les tout premiers résultats de recherche sur son moteur.

C’est donc ici qu’entre en ligne de compte l’importante d’une bonne optimisation de votre site, afin de gagner en popularité (et en PageRank), pour être suggéré en premier dans les résultats de recherche. Quand on sait que Google est de loin le plus gros joueur dans l’industrie de l’indexation et la recherche sur le Web, toute l’importance d’un bon PageRank prend sa juste et réelle dimension.

La manière d’augmenter son PageRank demande à mettre en place une série de mesures et de protocoles, tant lors de la conception du site, que de son design, encode, ainsi que son contenu.

Cette étape s’appelle l’optimisation pour les moteurs de recherche, ou mieux connu en anglais sous le vocable, SEO, pour search engine optimization.

Pour en savoir plus sur le SEO, nous vous invitons à lire notre autre article sur le sujet, en cliquant ici.

Louis Sirois, avocat - associé Web Clik Media

À propos de l’auteur : Me Louis Sirois est avocat et pratique le droit depuis 20 ans. Il est également le concepteur et l’administrateur de plusieurs sites web, dédiés à la pratique du droit et à la fourniture de services légaux en ligne.

Il s’intéresse aussi particulièrement aux nouvelles technologies visant la sécurité Internet et le développement de solutions de commerces électroniques fiables et sécuritaires.

 

Référencement et indéxation

Mercredi 1 octobre 2008

Tout d’abord, il faut préciser pour faire la différence entre référencement et indéxation, qu’il existe en gros deux types de ”moteurs de recherches” bien que ce terme ne corresponde en réalité qu’à l’un des deux.

Pour tenter d’illustrer cette différence, je dirai que Google est un moteur de recherche et que la Toile du Québec est un annuaire de liens

La différence ?  Google possède une technologie, une technique qui leur permet ”d’indéxer” des pages webs.  Ils ont conçu un ”robot” le GoogleBot qui, lorsque l’on lui a siginifié l’existance d’un nouveau site, le visitera sur une base régulière, et pourra ainsi découvrir les changement apportés, les nouvelles pages et ainsi de suite.

Par ailleurs, la Toile du Québec ne pratique pas une telle approche.  Elle ne consiste qu’en un annuaire de liens, plutôt statique, et payant par surcroît.  Vous comprendrez alors pourquoi vous trouverez souvent des liens vers des sites qui n’existent plus depuis longtemps.  Ils ne possèdent pas la technologie qui leur permet de déterminer de la ”prépondérance” d’un site par rapport à un autre, ni même d’en ”indéxer” les différentes pages.

Ainsi, l’indéxation pourrait être considérée comme le fait de voir son site analysé - indexé - par un moteur de recherche tel que Google, alors que le référencement serait plutôt le fait qu’un autre site fasse un lien vers le vôtre.

Les deux concepts ont chacun leur importance : naturellement, nous voulons tous voir notre site en première page dans Google.  Sauf que Google, pour accorder une ”note” à votre site ( PageRank) tiens compte d’une grande quantité de facteurs :

  • la qualité d’optimisation de votre site web
  • la quantité de contenu texte
  • la ”densité” des mots-clés ( la fréquence à laquelle on retrouve vos mots-clés dans le texte )
  • la popularité de votre site ( le nombres d’autres sites comportant un lien vers le votre )
  • l’importance des sites comportants des liens vers le votre ( leur PageRank )
  • la fréquence à laquelle les internautes choisissent de visiter votre site plutôt qu’un autre…

Ce n’est qu’un bref aperçu des nombreux critères qui justifient le classement d’un site dans un moteur de recherche tel que Google.

Le travail de votre webmaster est donc de bien préparer votre site - l’optimisation - et votre travail est d’obtenir que d’autres sites ( partenaires, collaborateurs, cients… ) fassent un lien vers votre site.

Une petite note sur les ”Link Farms”

Par Link Farm, on entend certains annuaires qui n’existent QUE POUR FAIRE DES LIENS  ( on parle aussi de ”liens en dur” ) et ainsi générer du PageRank.  Cette pratique qui a été très populaire auprès des webmasters, est de plus en plus décriée, voire même punie par certains moteurs de recherche.  La réussite d’un bon référencement  passe par des liens de qualité provenant de sites de qualité.