Algorithmes bas´es sur la projection ou la d´ecomposition

CHAPITRE 2 REVUE DE LITT´ ERATURE

2.3 Approche algorithmique de la classification de paquet

2.3.1 Algorithmes bas´es sur la projection ou la d´ecomposition

Une famille d’algorithmes utilisant la technique dite de projection a été largement dévelop- pée dans la littérature. On peut ainsi citer “Aggregated Bit Vector” (Baboescu et Varghese, 2001) ainsi que “Bit Vectors” (Lakshman et Stiliadis, 1998). Ces deux algorithmes décom- posent la recherche multidimensionnelle en autant de recherches unidimensionnelles que de champs traités. Ainsi, pour chaque dimension utilisée, un arbre est créé, dont les nœuds contiennent les informations permettant de connaitre la ou les règles associées à la comparaison partielle. A chaque recherche est associé un ensemble de règles pouvant correspondre à la comparaison partielle. Afin de déterminer la règle résultante du processus de classification, il suffit d’identifier la ou les règles partagées pour l’ensemble des résultats.

Un autre algorithme basé sur cette approche,“Cross producting scheme”(Srinivasan et al., 1998). Il a été con¸cu afin de supporter un nombre arbitraire de champs et d’être indépendant du type d’applications. Il vise à effectuer une recherche selon chacune des dimensions d (ou champs) utilisés et la combinaison des résultats partiels de chacune des recherches permet

d’accéder à la règle correspondante contenue dans une table dont les entrées ont été pré- calculées initialement. Cet algorithme offre une complexité en temps de recherche faible en O(d_{· t}rl), où trl est la complexité en temps de recherche pour identifier un intervalle selon

un champs. Cette faible complexité de recherche s’obtient au prix d’une consommation de mémoire gigantesque, puisque la table de“Cross-product”peut avoir O(md_{) entrées. De même,}

le processus de mise à jour est complexe car il demande la reconstruction complète de la table pré-calculée. Ainsi, en raison d’un cout de stockage prohibitif, l’algorithme “Cross Producting Scheme” n’est pas adapté à une utilisation avec un nombre élevé de règles.

Bien que ces algorithmes offrent une performance élevée en termes de vitesse de classification, ils consomment néanmoins une quantité excessive de mémoire. Cela rend donc ces algorithmes peut compatibles avec des applications nécessitant un nombre important de règles de classification. Dès lors, de nouveaux algorithmes ont vu le jour, afin de diminuer la surconsommation mémoire.

Comme mentionné précédemment, les algorithmes de classification doivent généralement faire un compromis entre rapidité de traitement, débit et consommation mémoire. À cet égard, “Recursive Flow Classification” (RFC) (Gupta et McKeown, 1999) et “Distributed Cross- producting of Field Labels” (Taylor et Turner, 2004) offrent un compromis plus intéressant entre la consommation mémoire et la bande passante, par rapport aux algorithmes précédents, mais souffre néanmoins de limitations. Malgré une consommation mémoire améliorée par rapport aux algorithmes antérieurs, celle-ci demeure importante (Singh et al., 2003). En effet, RFC est une variation de l’algorithme “Cross producting scheme” et, à cet égard, hérite de son défaut relatif à une grande consommation mémoire. RFC utilise une méthode heuristique pour classer les paquets. Considérons que le processus de classification implique l’association de l’entête d’un paquet de H bits à un identifiant d’action de T bit et que N règles sont présentes dans la table de classification utilisée. Une méthode simple, mais clairement sous- optimale, consiste à pré-calculer l’action associée à chacun des 2H _{paquets différents. Un tel}

processus nécessiterait l’utilisation d’un tableau de taille 2H_·2T_{. Un seul accès mémoire serait}

alors nécessaire pour identifier l’action associée à un paquet entrant, mais la consommation mémoire serait tout simplement astronomique. Le but de RFC est de procéder à la même association, mais au travers de plusieurs étages ou phases comme présenté dans la figure ci-dessous. Ainsi, l’association s’effectue de manière récursive : à chaque étage, l’algorithme procède à une réduction de la largeur de bits considérés.

Dans la figure 2.3, trois étages sont utilisés, mais RFC propose de faire varier le nombre d’étages suivant la performance envisagée. Dans le cas de l’exemple ci-dessus, les H bits utilisés pour identifier un paquet sont initialement découpés en plusieurs ”morceaux”, qui seront utilisés pour indexer différentes tables en mémoire lors de la première itération, c’est-

2H ₂T

Classification en une seule étape

2H ₂T

Classification récursive

Phase 1 Phase 2 Phase 3

Figure 2.3 Illustration du principe de l’algorithme RFC. Figure traduite et provenant de Gupta et McKeown, 1999

à-dire menant vers la phase 1. Chacune de ces recherches va associer à un ”morceau” un identifiant noté eqID, qui sont ensuite combinés et à nouveau découpés en ”morceaux”. Ces derniers vont être utilisés pour indexer différentes tables, lors de la même phase. Ce processus est répété jusqu’à ce que la dernière phase soit atteinte, et permette de spécifier la ou les règles associées au paquet entrant.

RFC permet d’atteindre en pratique un débit de 10 Gbps une fois implémenté en matériel mais, d’une part, ce débit offert semble relativement faible par rapport la vitesse des liens actuels et, d’autre part, RFC souffre d’une consommation mémoire élevée, ainsi que d’un temps de pré-calcul important lorsque le nombre de règles devient supérieur à 6000. Ces deux algorithmes présentent une capacité à monter en charge limité, ainsi qu’un compromis de performance médiocre entre temps de recherche et l’utilisation mémoire. Par conséquent, il est pertinent de se tourner vers des algorithmes adoptant d’autres approches et minimisant les compromis extrême entre temps de recherche et utilisation mémoire.

Dans le document AcceCuts: un algorithme de classification de paquets conçu pour traiter les nouveaux paradigmes des réseaux définis par logiciel (Page 31-33)