pertinence d une page web atelier sourdun 2012 v4

28 

Loading....

Loading....

Loading....

Loading....

Loading....

Texte intégral

(1)

Pertinence d’une page web

(2)

Pertinence d’une page web

 Présentation historique du web

Le World Wide Web (WWW),

littéralement la « toile (d’araignée) mondiale », communément appelé le

web, est un système hypertexte public

fonctionnant sur internet qui permet de consulter des contenus avec un

(3)

Pertinence d’une page web

 Présentation historique du web

 Le 13 mars 1989, Tim Berners-Lee,

engagé au CERN à Genève en 1984 pour travailler sur l’acquisition et le traitement des données, propose de développer un système hypertexte organisé en Web, afin d’améliorer la diffusion des

(4)

Pertinence d’une page web

 Présentation historique du web

 Le 6 août 1991, Tim Berners-Lee rend le

projet WorldWideWeb public dans un message sur Usenet.

(5)

Pertinence d’une page web

 Les moteurs de recherche avant

Google

 Un nouvel algorithme : motivations

(6)
(7)

Pertinence d’une page web

 La formule introduite par Sergueï Brin

et Larry Page dans l’article fondateur

 Un outil majeur : l’algèbre linéaire

 

 

11

 

 

22

 

 

1 ( ) n n PR T PR T PR T d PR A d N L T L T L T          L 

(8)

Mesurer l’importance d’une page web

 Un exemple

(9)

Mesurer l’importance d’une page web

 Le comptage naïf  inconvénient  manipulation

1

j i j

(10)

Mesurer l’importance d’une page web

 Le comptage pondéré  inconvénient  manipulation

1

j i j i

l

(11)

Mesurer l’importance d’une page web

Le comptage récursif

Une page j est importante si beaucoup

de pages importantes pointent vers j.

On tient compte de l’importance de la

page d’origine i et du nombre de liens qui en sont émis.

(12)

Mesurer l’importance d’une page web

Le comptage récursifplausibilitérobustesse

1

j i i j i

l

(13)

Mesurer l’importance d’une page web

Le comptage récursif : avec 1

1

n j i j i i

a

j n

 

1

si

0 sinon

i i j

i

j

l

a

 



(14)

Mesurer l’importance d’une page web

Le comptage récursif :

Les coefficients vérifient :

La matrice A constituée par ces coefficients est une matrice stochastique.

1 0 pour tout , et 1 pour tout i j n i j j a i j a i   

(15)

Mesurer l’importance d’une page web

Le comptage récursif :

système linéaire de n équations à n inconnues (les μi)

où W est la matrice ligne ayant pour coefficients les μi

(16)

Mesurer l’importance d’une page web

Le comptage récursif : interprétation

probabilité d’aller de la page i à la page j, en suivant un des liens au hasard

On modélise ainsi un surfeur aléatoire.

i j

(17)

Mesurer l’importance d’une page web

Le comptage récursif :

si l’on note Xp la position du surfeur après p étapes : soit

1

1

 

1 p n p X i p p i

P X

j

P



X

j P X

i

  

1

1 n p i j p i

P X

j

a P X

i

(18)

Mesurer l’importance d’une page web

Le comptage récursif :

où Up désigne la matrice ligne ayant

pour i-ème coefficient

1

p p

U

U A

p

(19)

Mesurer l’importance d’une page web

Le comptage récursif :

où Up désigne la matrice ligne ayant

pour i-ème coefficient

0 p p

U

U A

p

P X

i

(20)

Mesurer l’importance d’une page web

(21)

Mesurer l’importance d’une page web

 Un modèle plus raffiné : introduction du

coefficient de téléportation

avec probabilité c, le surfeur abandonne la page actuelle et recommence sur une des n pages du web, choisie de manière

équiprobable ;

avec probabilité 1 c, le surfeur suit un des liens de la page actuelle j, choisi de manière équiprobable parmi tous les liens émis.

(22)

Mesurer l’importance d’une page web

 On obtient : ou encore puisque

1

1

1

n p i j p i

c

P X

j

c

a P X

i

n

 

  

1

1

1

n p i j p i

c

P X

j

c a

P X

i

n

 

 

1

1

n p i

P X

i

 

(23)

Mesurer l’importance d’une page web

 Cela se traduit par la relation

matricielle :

où J désigne la matrice carrée de

format (n,n) dont tous les coefficients sont égaux à 1.

1

1

p p

c

U

U

J

c A

n

 

(24)

Mesurer l’importance d’une page web

 Ou encore: où

1

1

p p

U

 

c U A L

1 1

1

c

L

n

K

(25)

Mesurer l’importance d’une page web

 Suite de matrices lignes de type

arithmético-géométrique

on commence par chercher un point fixe : H

 en posant : , on obtient : puis p p VUH

1

0 p p p V   c V A

1

 

0

p p p U   c UH AH

(26)

Mesurer l’importance d’une page web

La constante c est un paramètre du

modèle.

c=0,15 correspond à suivre environ 6

(27)

Présentation d’exercices

possibles

(28)

Bibliographie

 Document ressource Éduscol (juin 2012)

 Michael Eisermann

Comment fonctionne Google ?

www-fourier.ujf-grenoble.fr/~eiserm

 Christiane Rousseau et Yvan Saint-Aubin

Figure

Updating...

Références

Updating...

Sujets connexes :