• Aucun résultat trouvé

Notre modèle eectue la même tâche que les participants sur les pseudo pages Web. Comme nous l'avons vu précédemment, deux paramètres (αH et αG) modulent la stratégie globale du modèle et donc la forme du trajet.

Ajustement du modèle 105 Il n'y a pas de valeurs uniques pour ces paramètres étant donné la variabilité des trajets d'un individu à l'autre, mais il nous fallait déterminer des plages de variations des paramètres correspondant à la variabilité inter-individuelle observée. La méthode employée a été tout d'abord d'observer les comportements empiriques an d'établir la distribution de ces trajets. En parallèle de ces observations, nous avons déterminé quels étaient les trajets générés par le modèle selon les couples de paramètres αH

et αG. À partir de ces deux informations, nous avons ajusté les intervalles de αH et αG pour obtenir une distribution semblable. Les données issues de l'expérience en lignes et en colonnes ont donc servi à l'apprentissage du modèle. Les données issues de l'expérience en pêle-mêle serviront, elles, au test du modèle.

Nous nous sommes basés sur l'expérience avec les blocs organisés en lignes et en colonnes pour générer tous les trajets possibles issus des combinaisons de αH et αG

dans l'intervalle raisonnable [0-5] avec un pas de 0,1 et en avons extrait les six trajets les plus fréquents (dont les trajets en U et N inversé). Nous avons ensuite cherché à savoir quelles étaient les stratégies des participants. Pour cela, nous avons classé tous les trajets empiriques selon leur distance avec les trajets prototypiques, en ne prenant que les premières visites sur les blocs. La mesure de distance utilisée est celle de Levenshtein (Navarro,2001).

La distance de Levenshtein mesure la similarité entre deux chaînes de caractères. Elle correspond au nombre minimal de caractères qu'il faut supprimer, insérer ou remplacer pour passer d'une chaîne à l'autre. Un trajet est codé en une chaine de caractères représentant les blocs numérotés de 1 à 8. Par exemple le trajet en U est codé "12348765" et le trajet en N inversé "12345678". La distance entre ces deux trajets est de 4.

Pour cette répartition des trajets, seuls les trajets dont la distance minimale avec un trajet prototypique était inférieure à 4 ont été pris en compte, les trajets n'ayant que peu de transitions sont donc indéterminés. Les trajets se trouvant à la même distance de deux trajets prototypiques ont été comptés comme appartenant aux deux classes.

À partir de cette répartition, nous avons implémenté un algorithme simple de recherche des intervalles pour αH et αG pour lesquels le modèle générait la réparti-tion la plus proche. Ces intervalles sont ainsi [0,7-2,3] pour αH et [1-2,4] pour αG. La gure 5.7 montre la répartition des trajets du modèle sur les blocs organisés en lignes et en colonnes dans cet espace à deux dimensions. Chaque couple (αH, αG) correspond à un trajet. Parmi les trajets ainsi générés, seuls deux ne faisaient pas partie des six trajets prototypiques. Les deux paramètres αH et αGpermettent d'une manière simple de bien rendre compte de la variabilité de trajets, comme nous pou-vons le voir en comparant les répartitions dans le tableau 5.1ou sur l'histogramme correspondant (gure5.8 page suivante).

Figure 5.7  Répartition des trajets du modèle selon les deux dimensions.

Figure 5.8  Répartition des trajets des participants et du modèle selon le type de trajet.

Ajustement du modèle 107

Participants Modèle

Trajets Proto Nombre % Total % Classés Nombre % Total % Classés

. N : 348 39,32% 46,90% 117 45,88% 46,25% U : 209 23,62% 28,17% 72 28,24% 28,46% Z : 35 3,95% 4,72% 15 5,88% 5,93% N2 : 11 1,24% 1,48% 9 3,53% 3,56% U2 : 27 3,05% 3,64% 17 6,67% 6,72% Z2 : 112 12,66% 15,09% 23 9,02% 9,09% Indéterminés 143 16,16% 2 0,78% Total 885 256

Table 5.1  Répartition des trajets de participants et du modèle sur les pages avec les blocs structurés en lignes et en colonnes entre les six trajets prototypiques. Génération des instances du modèle

Une fois les intervalles de ces paramètres déterminés nous avons tiré aléatoirement trente-six combinaisons de paramètres dans ces intervalles pour simuler trente-six instances du modèle, à comparer avec les trente-huit participants. Nous avons choisi de prendre trente-six instances car nous avions trente-huit participants ; nous avons donc pris le multiple de 6 le plus proche de 38 (car nous avons six listes diérentes). Ces trente-six instances ont été réparties dans les six listes, générant 720 trajets (36 × 20 thèmes).

Pour l'expérience avec les blocs organisés de manière moins structurée (pêle-mêle), nous avons gardé les mêmes intervalles an de valider la robustesse de notre modèle. Le modèle a tourné sur les huit listes (quatre dans la modalité Sans Titre et quatre pour la modalité Avec Titre). Trente-deux instances du modèle ont ainsi été simulées (à comparer avec les vingt-sept participants), générant 640 trajets (320 pour la modalité Sans Titre et 320 pour la modalité Avec Titres).

Pour chaque simulation, nous avons arrêté le modèle, qui n'a pas de condition d'arrêt, quand il avait atteint le nombre moyen de blocs vus par les participants sur la page.

Validation du paramétrage

À l'issue de cette première expérimentation, nous avons cherché à savoir si les participants et le modèle ont une même stratégie de parcours des blocs avec d'autres indicateurs que ceux qui nous ont permis de paramétrer le modèle. Nous avons ainsi observé que la première colonne (celle de gauche) est presque toujours parcourue de haut en bas, à la fois par les participants (79,07%) et le modèle (96,25%). Celle de droite est parcourue vers le haut pour 27,14% des participants, et 39,30% des instances du modèle, et vers le bas pour 62,92% des participants et 56,38% pour le

Figure 5.9  Matrice de transitions entre les blocs pour les participants et le modèle. Les blocs sont numérotés de 1 à 4 pour la première colonne et de 5 à 8 pour la seconde. modèle. Ces caractéristiques n'ont pas été directement optimisées par le paramétrage du modèle, elles en sont néanmoins très liées. Nous nous attendions ainsi à cette correspondance. Nous pouvons toutefois noter que le modèle a une tendance plus forte que les participants à descendre la colonne de gauche, ainsi qu'à monter celle de droite.

Des matrices de transitions (gure5.9) entre chacun des huit blocs nous montrent aussi les similitudes entre les trajets des participants et ceux du modèle. La couleur de la case (i,j) dénote le nombre de transitions du bloc i au bloc j. Plus la couleur est foncée, plus le nombre de transitions est important. Les blocs sont numérotés de 1 à 4 pour la première colonne et de 5 à 8 pour la seconde.

Ces matrices montrent qualitativement qu'avec un simple algorithme de plani-cation de chemin et deux paramètres indiquant la tendance à aller vers le bas et vers la droite, il est possible de reproduire assez nement la stratégie globale des parcours dans cette tâche de recherche d'information.

5.4 Comparaison du modèle avec les données empiriques