Nous présentons dans cette partie deux types de cycles de RàPC : le cycle classique de
RàPC, d’une part, et le cycle amélioré de RàPC, d’autre part. Cela nous amènera à décrire les
différentes étapes de ces cycles.
2.4.1. Le cycle du RàPC Classique
Le cycle de résolution de problèmes du RàPC a été proposé la première fois par Aamodt
et Plaza [Aamodt & Plaza, 1994]. Cet auteur a proposé les quatre étapes suivantes :
Remémorer ou Retrouver
1, Réutiliser
2, Réviser
3, Mémoriser
4• Élaboration : l’élaboration consiste en la formalisation de la description du problème
à résoudre en vue de la remémoration.
. Ce cycle a été complété plus
tard par Mille [Mille, 2006], (figure 6 ci-après), en ajoutant une étape supplémentaire avant la
remémoration. Cette étape s’appelle « Élaboration ». Nous présentons ci-après une brève
description des cinq étapes du cycle RàPC:
• Remémoration : l’objectif est de trouver et de sélectionner des cas sources similaires
pour la résolution du problème en cours (problème cible).
• Réutilisation : la réutilisation consiste à adapter les solutions des cas sources pour
résoudre le problème cible.
• Révision : cette partie comporte deux étapes : évaluer la solution produite par la
réutilisation et corriger la solution en utilisant la connaissance spécifique du domaine.
• Mémorisation : l’objectif est l’intégration et la mémorisation de la nouvelle solution
dans la base de cas. C’est l’étape de l’enrichissement de la base de cas.
1 Retrieve
2 Reuse
3 Revise
49
Figure 6. Le Cycle de Raisonnement à Partir de Cas [Source : Mille, 2006]
2.4.2. Élaboration
Dans le cycle du RàPC, la première phase définie par Aamodt [Aamodt, 1994] est la
remémoration. Selon Mille [Mille, 2006], cette étape pourra être améliorée en ajoutant une
nouvelle phase en amont de la remémoration. Cette phase amont est appelée « élaboration ».
Cette étape consiste alors, à partir de l’entrée du système du RàPC, à construire le problème
cible :
Élaboration : pré-cible ↦ cible
Où, la pré-cible dénote l’entrée du système de RàPC, c'est-à-dire, le problème cible
avant sa mise en forme. La mesure de similarité réalisée dans la phase de remémoration
exprime ainsi l’importance et l’influence des descripteurs de problèmes pour sélectionner un
cas dont la solution sera adaptable en vue de la résolution d’un problème cible. Cette phase
nécessite deux tâches principales : création d’un cas et préparation du cas [Fuchs, 1997]. Lors
de l’élaboration, un nouveau cas est créé et la description du problème est ensuite complétée
en collectant d’autres informations pertinentes pour le problème à résoudre. La deuxième
tâche s’agit de préparer le cas, c'est-à-dire choisir les indices adéquats pour la recherche des
cas. Ces indices sont les descripteurs du cas considérés comme pertinents pour la résolution
du problème et utilisés comme critères de recherche dans la base de cas. Ceci est en vue de la
remémoration en choisissant les indices à utiliser pour se remémorer un cas passé. Le rôle de
50
l’élaboration est donc de construire les descripteurs influents afin que la recherche des cas
proches puis l’adaptation soit efficace [Fuchs et al., 2006].
2.4.3. Remémoration
La phase de remémoration est une étape importante dans un système de RàPC. L’une
des hypothèses majeures dans le RàPC est de dire que des expériences similaires peuvent
guider de futurs raisonnements, des résolutions de problèmes et permettre un apprentissage de
la base de cas. La remémoration est donc le processus qui permet de retrouver des cas sources
similaires au cas cible. Les cas sources similaires sont des cas qui ont besoin de moins
d’adaptation. La mesure de similarité cherche la ressemblance entre les descripteurs des
sources et cibles. Les tâches de remémoration consistent à « rechercher » des cas similaires, à
les « apparier », c'est-à-dire les « évaluer et calculer la similarité », et enfin à « sélectionner »
le cas source le plus adapté.
Dans l’étape de l’« appariement », une mise en correspondance des descripteurs de
problèmes deux à deux s’effectue et est suivie par une évaluation qui permet d’estimer la
similarité et l’ordonnancement des cas en conséquence. Nous détaillons ci-après ces
techniques.
L’étape de sélection choisit un ou plusieurs cas en fonction de cet ordonnancement. Le
poids d’un attribut est compris dans l’intervalle [0, 1]. Un attribut ayant un poids de 1 est
considéré comme très important puisque ce poids est le poids maximum. A l’inverse, un
attribut ayant un poids de 0 est considéré comme négligeable. Cette pondération interviendra
pour la recherche des cas sources les plus proches du cas cible.
2.4.3.1. Les techniques de recherche des cas similaires
Mesure de similarité
Il existe différentes méthodes pour calculer la similarité ou la dissimilarité. La distance
de Minkowski est la plus connue et est souvent utilisée. Il s’agit de calculer la distance
relative entre le cas cible et le cas source [Fuchs, 2008] [Pal et al., 2004].
n : est le nombre d’attribut
C : est le cas cible
C
i: est le descripteur de cas cible
S : est le cas source
p n i p i i i
C S
w
S
C
Sim
/ 1 1)
,
( =∑ × −
=51
S
i: est le descripteur du cas source
w : est le poids de l’attribut i
En fonction du paramètre p :
p=1 distance Manhattan
p=2 distance euclidienne
p=∞ distance de Chebychev (Max∣C
i- S
i∣)
Plusieurs techniques de similarités existent dans la phase de remémoration : K Plus Proches
Voisins
1(KPPV), les approches inductives
2, la logique floue
3ou encore les réseaux neurones
4L’approche K Plus Proches Voisins
. Nous décrivons par la suite les deux approches plus utilisées dans ce domaine : L’approche
K Plus Proches Voisins ainsi que les approches inductives.
La technique K Plus Proches Voisins est la technique la plus utilisée dans les RàPC.
Cette technique est établie selon la mesure de Minkowski. Elle est basée sur les poids des
descripteurs w
iqui évaluent la similarité entre les cas sources de la base de cas et le cas cible.
Le poids permet alors de modifier l’importance d’un descripteur par rapport à un autre
descripteur. La partie la plus délicate dans cette technique est de définir les poids des
descripteurs. Dans l’équation 1, w est le poids du descripteur, sim est la fonction de similarité,
et d
iCet d
iSsont des valeurs du descripteur i dans le cas cible et respectivement dans le cas
source.
Les approches inductives
Les approches inductives déterminent quels sont des descripteurs qui apportent un
meilleur effet pour une discrimination des cas. Les algorithmes d’Induction, tels que ID3
[Quinlan, 1986] et CART (Classification And Regression Trees), permettent de construire des
arbres de décision à partir des cas de la base de cas. Ces algorithmes d'induction divisent les
cas en grappes
51 K- Nearest Neighbours (K-NN)
. Chaque cluster contient des cas similaires. Les techniques d'induction sont
2 Inductive approaches 3 Fuzzy logic 4 Neural networks 5 Clusters
( )
∑
∑
= =×
=
n i i n i S i C i iw
d
d
sim
w
S
C
Similarité
1 1,
)
,
(
52
utilisées majoritairement comme des classificateurs pour regrouper des cas similaires. Ils
déterminent quels descripteurs sont à même de mieux distinguer les cas et de générer une
structure de l’arbre de décision pour organiser le cas de la base de cas.
Dans la technique d’induction, l’idée principale est de pouvoir regrouper des cas qui
sont similaires les uns aux autres et d’essayer de trouver la grappe qui correspond le mieux à
la nouvelle situation, cela en fonction du domaine de connaissances générales. Par
conséquent, seuls les cas d’un cluster précis seront pris en compte dans la recherche d’un
meilleur appariement des cas. Le succès de l’indexation par l’approche inductive sera fonction
de la pertinence de l’arbre de décision pour les cas remémorés [Shin & Han, 2001] [Shin et
al., 1997].
2.4.4. Réutilisation
La phase de réutilisation des cas est le processus qui permet de transformer une solution
remémorée en une solution appropriée pour le problème en cours de résolution. La
réutilisation des cas remémorés pour un nouveau cas se focalise sur deux aspects :
• Quelle différence existe entre le cas source remémoré et le cas cible ?
• Quelle partie du cas remémoré pourra être transférée au nouveau cas ?
Cette réutilisation amène à réaliser deux tâches : copier et adapter. Lors de l’étape de la
copie, la solution ou la méthode de solution des cas remémorés est transférée au nouveau cas.
La tâche adaptée modifie la solution ou sa méthode lorsque la solution source n’est pas tout à
fait pertinente. Lorsque plusieurs cas sont remémorés, une solution pourra être dérivée de
plusieurs cas ou bien plusieurs alternatives pourront être proposées. Il existe alors trois façons
d’adapter des cas remémorés :
Réinstantiation
1Adaptation substitutionnelle
: Lorsque le degré de la similarité entre le cas cible et le cas source remémoré
est trop élevé et il n’y a pas de contrainte imposée sur la solution. La réinstantiation est la
façon la plus simple en adaptation. La solution pour un nouveau problème est copiée
directement, sans modification, à partir du cas remémoré.
2
Adaptation transformationnelle
: La substitution remplace la partie du descripteur de solution
remémorée qui n’est pas valide aux besoins du nouveau problème.
3
1 Reinstantiation
: La transformation est utilisée lorsqu’il n’y a aucune
substitution appropriée à la disponibilité. Une solution pertinente sera dérivée à partir de la
base des contraintes et des caractéristiques de la solution demandée. Par exemple : il est
2 Substitution adaptation