• Aucun résultat trouvé

8.5. Extraction de Règles Séquentielles Orientées Phases avec PhARules

8.5.3. Complexité computationnelle

La complexité de l algorithme PhARules est fonction de la complexité de phaseDispatcher() à

l étape Cf. Figure 8.2) et de la complexité de l algorithme d extraction de règles d association à l étape . Des algorithmes de l état de l art, tel que Apriori, peuvent être utilisés pour cette tâche. La complexité computationnelle de ces algorithmes, est influencée par les principaux facteurs suivants : le support minimum fixé, le nombre d items distincts, le nombre de séquences, la

longueur moyenne des séquences nombre moyen d items que contient chaque séquence [Tan et al. 2006, p. 345].

Pour le scénario de l exécution de PhARules, la complexité computationnelle de la fonction phaseDispatcher() est affectée par les paramètres suivants :

le nombre de séquences dans la base,

la longueur moyenne des séquences

et le nombre de phases.

Pour le scénario 2, il faut ajouter le nombre de descripteurs fournis en entrée et le nombre moyen

d interactions incluses dans les descripteurs.

De manière générale, le temps d exécution de PhARules est fonction :

des supports et confiance minimum fixés

du nombre de phases à identifier

du nombre de séquences de la base

du nombre de séquences dans chaque phase

de la longueur moyenne des séquences

La réduction des seuils de support et de confiance ou l incrémentation des autres paramètres, augmente le temps d exécution et la consommation de ressources nécessaires à l algorithme pour la répartition des phases et l extraction de règles relatives à ces phases.

R dui e le te ps d’e utio de PhARules

La répartition des phases est une opération couteuse de l algorithme PhARules, particulièrement dans le deuxième scénario décrit dans la section précédente. Pour réduire le temps d exécution

nécessaire à la répartition des phases, il est possible d intervenir au niveau de la recherche de correspondances entre les interactions incluses dans la séquence en cours d analyse et les

interactions incluses dans les descripteurs.

Dans un premier temps, il s agit d encoder toutes les interactions avec des valeurs numériques. A

partir de l étape du bloc « procédure » (Cf. figure 8.4), après la décomposition de la séquence en

unités d interaction, leurs codes numériques doivent être ordonnés dans l ordre croissant. La vérification de la correspondance d une séquence avec un descripteur peut ainsi se faire en

appliquant la recherche dichotomique. La même opération doit être répétée à partir de l étape de la procédure. Le temps d exécution de l identification des phases des séquences peut être ainsi

réduit en diminuant le nombre de comparaisons nécessaires à la fonction phaseDispatcher() pour

identifier la phase d une séquence.

Une autre méthode consiste à procéder à l extraction des règles en deux temps en externalisant le

processus de répartition des séquences dans des phases. Le framework PeTRA offre cette possibilité avec son opérateur de répartition de phases (voir section « 7.3.4. L’opérateur de

répartition de phase ») qui permet de tagger les séquences avec la référence de la phase à laquelle elles appartiennent. Ensuite, l algorithme PhARules est appliqué sans la fonction phaseDispather(). Il identifie les séquences sur la base de leur tag et peut ainsi procéder à

l extraction des règles en prenant en compte cette information pour le calcul du support et de la confiance de chaque règle.

Les deux alternatives peuvent être combinées en appliquant l encodage et la recherche dichotomique à la tâche de répartition externalisée avant d appliquer l algorithme PhARules.

8.5.4.Bilan

L algorithme PhARules a été conçu pour extraire des règles séquentielles communes à plusieurs

séquences en considérant leur importance relativement à une phase d exécution. L intérêt est d extraire des patterns fréquents d interactions enregistrées dans des traces d activités d apprentissage, spécifiquement des activités impliquant des problèmes dont la résolution

s effectue en plusieurs phases.

L exécution de PhARules est relativement coûteuse en temps à cause, notamment, de l opération

de répartition des séquences enregistrées dans les phases auxquelles elles correspondent. De

plus, l identification de la phase d une séquence se base sur des descripteurs fournis par l utilisateur. Ces descripteurs doivent être spécifiés. Ce travail de spécification est potentiellement

fastidieux lorsque les frontières entre les phases ne sont pas connues, c est-à-dire, lorsque

l ensemble des interactions survenant dans chaque phase ne peut pas être défini de façon exhaustive et de manière à être distinct des ensembles d interactions relatifs aux autres phases. De plus, les descripteurs définis sont forcément dépendant du domaine.

Nous avons voulu explorer une alternative plus générique et qui affranchit de ce travail de spécification en détectant automatiquement les frontières entre les phases distinctes dun

processus de résolution de problème. Cette méthode vise par la même occasion à détecter

automatiquement les comportements significatifs de l apprenant au cours de la résolution du problème, fournissant ainsi une description de l activité de l apprentissage en réduisant le travail du chercheur (ou du tuteur) en amont. Cette méthode est décrite plus loin dans la section « 9.3.

Exploration d’une extension du modèle par la détection automatique du parcours de résolution de l’apprenant ».

8.6. C

ONCLUSION

Dans ce chapitre, nous avons décrit l algorithme PhARules proposé dans le but d extraire des règles séquentielles dont l importance se conçoit relativement à une phase. Une phase est définie comme une partie distincte d un cas de résolution de problème. Au-delà du contexte

d apprentissage, le concept de phases s inscrit dans la problématique plus large de l hétérogénéité interne des données en datamining. Nous avons fait une revue de l état de l art relatif à cette

problématique après avoir défini quelques notions préliminaires. Celles-ci se réfèrent à

l extraction de connaissances avec les paradigmes du datamining ex : patterns fréquents et règles

d association, patterns et règles séquentiels . Nous avons décrit l adaptation de ces paradigmes

aux connaissances de type perceptivo-gestuel qui nous intéresse dans ce travail. Nous avons ainsi proposé les notions de patterns et de règles perceptivo-gestuels. Ces derniers ciblent les

interactions multimodales fréquentes de l apprenant. L exploitation de ces patterns et règles perceptivo-gestuels visent à modéliser les connaissances de l apprenant ainsi que les

connaissances du domaine en adéquation avec leur nature multimodale.

Après une revue de la littérature sur les propositions adressant la problématique de

l hétérogénéité interne des données, nous avons caractérisé la notion de phase telle que nous la

concevons. Dans le contexte de l analyse de traces d apprentissage, la prise en compte des phases de résolution d un problème est importante dans la mesure o‘ cela permet de cibler les différentes

Dans le chapitre suivant, nous décrivons les expérimentations conduites pour évaluer nos différentes propositions.

S

YNTHESE

o P opositio d’u algo ith e pou l’e t a tio de gles s ue tielles o ie t es phase : PhARules

o Conception de la procédure phaseDispatcher()pou l’ide tifi atio des phases de solutio d’u poblème

o Proposition de spécification des descripteurs de phase de résolution selon deux scénarios

o Proposition des concepts de « patterns gestuels » et de « règles perceptivo-gestuelles »

P

ARTIE

4

CHAPITRE 9.

EXPERIMENTATIONS

Dans ce chapitre, nous décrivons les expérimentations conduites pour l’évaluation des

principales propositions de cette thèse : le modèle de représentation des séquences perceptivo-gestuelles, le framework PeTRA permettant de réifier ce modèle et PhARule,s

l’algorithme d’extraction de règles perceptivo-gestuelles orientées phases. Nous présentons aussi ici les évaluations conduites sur une proposition de méthode de détection automatique des parcours de résolution de problèmes de l’apprenant.

Sommaire

Documents relatifs