DISCUSSION G´ EN´ ERALE - AcceCuts: un algorithme de classification de paquets conçu pour trait

DISCUSSION G´EN´ERALE

L’article présenté dans le chapitre, 4, a permis d’affirmer que l’algorithme EffiCuts, trans- posé dans le contexte de SDN ne permet pas d’atteindre des performances décentes. En effet, malgré une consommation de mémoire raisonnable, le nombre d’accès mémoire a tout sim- plement explosé. Ce problème est majoritairement du au nombre élevé d’arbres à parcourir, conséquence directe de l’augmentation du nombre de champs considérés.

Par ailleurs, il est aussi important de remarquer que, comparé à (Vamanan et al., 2010), où seuls 5 champs sont considérés, la consommation mémoire de l’algorithme présenté dans le chapitre 4 demeure dans le même ordre de grandeur. En effet, l’algorithme EffiCuts fait levier sur de multiples méthodes pour minimiser la valeur du facteur de réplication et ainsi minimiser l’espace occupé par chaque règle, de telle sorte que l’augmentation de la taille des règles a un impact limité au niveau de la taille de la structure générée. De plus, les nombreux arbres construits dû à la prise en compte de 12 champs, sont majoritairement de petits arbres, contenant un nombre faible voir très faible de règles. Par conséquent, ce type d’arbre a une influence très restreinte au niveau de la taille de la structure de donnée générée. Ces deux justifications permettent d’expliquer les performances rencontrées par l’algorithme EffiCuts, dans sa version non optimisée, dans un contexte de SDN. Bien que l’extensibilité soit bonne en termes d’occupation mémoire, l’extensibilité de cet algorithme est très mauvaise concernant le nombre d’accès mémoire.

Les trois optimisations présentées dans (Stimpfling et al., 2013) permettent de réduire de manière importante la consommation mémoire ainsi que le nombre d’accès mémoire et d’atteindre une performance acceptable pour envisager une implémentation matérielle ou logicielle. Ainsi le nombre d’accès mémoire moyen a été réduit par un facteur 2, alors que la consommation mémoire est réduite de 35% en moyenne par rapport à EffiCuts.

Néanmoins, on remarquera que l’optimisation “Leaf size modulation” est une optimisation partielle, dans la mesure où, dans le contexte présenté, on constate que ce paramètre a une influence sur la performance et notamment le nombre d’accès mémoire mais que la performance est sujette à variation. Dès lors, le problème sous-jacent, à savoir le parcours linéaire des feuilles, n’est pas traité. Ce point amène deux autres questions ; Quelle partie des arbres “comprimer” pour diminuer le nombre d’accès mémoire ? et Peux-t-on proposer une alternative au parcours linéaire des feuilles ?. Le chapitre 5 vise à apporter un éclairsissement à ces questions.

Le second article présenté dans le chapitre 5, permet de pousser la reflexion plus loin, via une analyse détaillées de la performance et des problèmes rencontrés par EffiCuts dans le contexte de SDN. La solution proposée, AcceCuts va beaucoup plus en loin en termes de performance par rapport à ce qui a été proposé dans le chapitre 4. En effet, la réduction moyenne du nombre d’accès mémoire atteind un facteur 3, et une diminution de 45% de l’occupation mémoire est obtenue par rapport à EffiCuts. La grande différence entre ces deux chapitre repose sur la modification de la structure des feuilles introduite par AcceCuts, et qui impact drastiquement sur le nombre d’accès mémoire en impactement de manière très limitée sur la taille de la structure de donnée générée. Il est par ailleurs intéressant de noter que jusqu’à présent, dans la littérature, aucune contribution n’a été faite concernant la structure des feuilles.

Par ailleurs, l’article (Stimpfling et al., 2013) mentionne qu’en raison de l’absence de géné- rateur de règles synthétiques reprenant des caractéristiques de tables de classification réelles, une méthode de génération de règles a été proposée combinant deux générateurs de règles, l’un, ClassBench permettant de créer des règles avec des typages et l’autre, FRuG, dont les paramètres de génération sont laissés à la discrétion de l’utilisateur. Dans un tel cas, il parait impossible de configurer FRuG pour recréer des patrons de règles utilisées réellement dans des tables de classification. Certains sites offrent, à des fins de recherche, des traces de paquets (CAIDA : The Cooperative Association for Internet Data Analysis) mais ces traces ne permettent pas de déterminer les caractéristiques des règles associées qui ont filtré ces paquets. Par conséquent, la solution retenue a été de configurer FRuG afin d’encadrer la performance de l’algorithme testé, en créant deux scénarios permettant de simuler le meilleur ainsi que le pire des cas. Néanmoins, une telle approche est discutable, non pas sur le principe, mais bien sur les paramètres qui ont été associés au meilleur et pire cas. Autant, il est peu important d’avoir un “meilleur cas” éloigné (en dessous) du “meilleur cas” réel, dans la mesure où le seul risque est de ne pas obtenir des résultats potentiellement meilleurs. Autant un scénario illustrant le pire des cas et configuré de manière trop avantageuse peut être lourd de consé- quence. En effet, dans la littérature la performance des algorithmes est souvent étudiée par rapport au pire des scénarios, afin de garantir des performances, et ce sont ces mesures qui permettent de déterminer si oui ou non l’algorithme est digne d’intérêt ou non.

De même, la situation inverse est aussi envisageable, à savoir que les paramètres entrés pour configurer le générateur de règles représentent certes un scénario engendrant la pire performance d’un point de vue théorique, mais rien ne dit que cette situation va être rencontrée dans un contexte de production. De fait, le pire des scénarios simulés peut se situer très loin du pire des scénarios réels et, donc, les performances réelles peuvent s’avérer sensiblement meilleures que celles simulées. Il est important de considérer ces faits et de rappeler que la

seule simulation valable demeure celle effectuée avec des règles utilisées dans un environne- ment de production.

Néanmoins, ces deux remarques demeurent valables dans le cas de l’algorithme AcceCuts présenté dans le chapitre 5, puisque ce dernier se base sur les mêmes benchmark.

Dans le document AcceCuts: un algorithme de classification de paquets conçu pour traiter les nouveaux paradigmes des réseaux définis par logiciel (Page 105-108)