État de l’art de la recherche sur le pilotage des réacteurs

2.6 Conclusion

3.1.2 État de l’art de la recherche sur le pilotage des réacteurs

Un réacteur nucléaire est un système intrinsèquement non linéaire. Mêmes dans ses modèles les plus simples (réacteur point), il présente des non linéarités significatives. Cette propriété en fait un objet d’étude très intéres- sant pour les automaticiens. Ainsi, de nombreuses méthodes avancées de contrôle des réacteurs sont disponibles dans la littérature. Cette section présente un état de l’art de ces méthodes.

Aujourd’hui, les contrôleurs présents sur les réacteurs sont essentiellement des contrôleurs PID (Propor- tionnel, Intégral Dérivé). Dans un correcteur PID, la commande est la somme d’un signal proportionnel à l’erreur, d’un signal proportionnel à l’intégrale de l’erreur, et d’un signal proportionnel à la dérivée de l’erreur. Cette section présente des méthodes de contrôle optimal : LQG/LTR (Loop Transfer Recovery), SMC (Sliding Mode Contrôle), contrôleH∞, horizon glissant et méthodes avancées de PID. Un état de l’art plus complet des

méthodes de contrôle et des modèles de réacteurs qu’elles utilisent est disponible dans [42].

3.1.2.1 Modèles de REP

La plupart des méthodes sont dépendantes du modèle utilisé pour décrire le réacteur. Trois modèles sont typiquement utilisés, présentés ici du plus utilisé au moins utilisé :

— Modèle de réacteur point. Le cœur est considéré comme un point et les effets de distribution spatiale sont négligés. C’est l’approche la plus courante.

— Modèle de réacteur bipoint. Le cœur est séparé en une partie haute et une partie basse. Cette modélisation permet d’appréhender la distribution axiale de puissance. On peut également augmenter le nombre de nœuds axiaux.

— Les modèles 3D utilisant des codes de simulation. Ce type de modèle est très peu utilisé pour l’établis- sement de contrôleurs. Cependant il peut-être utilisé pour le calibrage, notamment pour les technologies PID.

Plusieurs approches sont possibles à partir de ces modèles : linéariser autour de points de fonctionnement, afin d’utiliser les techniques bien connues de l’automatique linéaire, ou s’attaquer aux non-linéarités frontalement avec des méthodes appropriées.

3.1.2.2 State-Feedback Assisted Control

Le contrôle par retour d’état désigne toutes les boucles de contrôle utilisant la connaissance à tout instant de l’état complet du système pour construire la commande. Dans de nombreux cas, une telle connaissance est impossible, et il faut recourir à un observateur permettant de reconstituer les variables manquantes.

Le design de la boucle peut notamment utiliser les techniques d’optimisation quadratique gaussienne (LQG) et de Loop Transfer Recovery (LTR)([41], [43]-[45], [87]).

La commande linéaire quadratique est un problème classique. Dans sa version gaussienne, on ajoute un bruit blanc de variance connue. Le but est de minimiser un critère quadratique permettant d’arbitrer entre l’écart de l’état à sa référence et l’utilisation accrue des moyens de commande.

Le régulateur LQG n’ayant pas de bonnes caractéristiques de robustesse, il est souvent couplé à la méthode LTR, une heuristique permettant d’améliorer la robustesse de la boucle de contrôle.

3.1.2.3 Sliding Mode Control

Le Sliding Mode Control part de l’idée suivante : face à un système à la dynamique compliquée, plutôt que d’essayer de ramener directement l’état à la référence, on amène le système dans un état où il reviendra

naturellement à la référence.

On considère donc une surface de glissement, qui s’écrit par exemple :

σ = ˙e + me, (3.3) oùe désigne l’erreur et m est une constante. Si σ = 0, on maîtrise la dynamique de retour à l’équilibre du système. L’objectif est désormais essayer de maintenir cette condition. La surface de glissement doit-être judicieusement choisie pour qu’on puisse y ramener le système.

Une convergence asymptotique vers σ = 0 n’est pas suffisante. On va donc faire changer la commande de signe autour de la condition, pour que le système oscille rapidement autour. La dynamique de retour à l’équilibre sera alors assurée. On prendra par exemple la consigne :

u(t) = U σ(t)

|σ(t)| (3.4)

Cette méthode à été explorée pour le contrôle de réacteur par Ansarifar et Saadatzi dans [3] et [69], en utilisant un modèle de réacteur à deux points, dans un contexte de suivi de charge. La stabilité de la méthode est prouvée, ainsi que sa robustesse.

Afin d’éviter les oscillations brusques de commande, une tangente hyperbolique est utilisée à la place du signe deσ. Cependant, on constate quand même des variations rapides de vitesse des barres de contrôle. Dans le cadre de ces travaux, le bore soluble n’est pas utilisé, mais ce genre de variations rapides pourrait avoir un impact significatif sur le volume d’effluents.

Le régulateur proposé est extrêmement efficace pour réduire l’amplitude des oscillations xénon. Un observateur robuste est également créé pour reconstruire la concentration de xénon par le calcul pendant le transitoire. Le SMC est à la fois robuste face aux perturbations et peut être implémenté sans connaître la valeur des paramètres du modèle précisément.

3.1.2.4 Horizon glissant (Model Predictive Control)

Les méthodes MPC sont basées sur la connaissance d’un modèle du système. A chaque pas de temps, le contrôleur prédit le comportement du système sur un horizon donné, puis optimise le pilotage sur cet horizon. La première valeur de consigne est utilisée, puis le contrôleur recommence ce procédé au pas de temps suivant. Ces méthodes sont aussi appelées « à horizon glissant », à cause de ce procédé de prédiction se décalant dans le temps à chaque pas.

Les degrés de liberté sont les suivants :

— Quel modèle intermédiaire utilise-t-on dans le contrôleur ?

— Quel modèle utilise-t-on pour simuler la réponse effective du réacteur ? — Quelle valeur choisit-on pour l’horizon à simuler ?

— Sur quel critère le contrôle est-il optimisé sur l’horizon courant ? — Quel algorithme est utilisé pour le minimiser ?

Dans [33], Kim, Park et Na utilisent un algorithme génétique pour minimiser un critère quadratique sur l’écart et l’utilisation des moyens de commandes. Le modèle intermédiaire du cœur est enrichi au fur et à mesure de la simulation en corrigeant les paramètres du modèle. Le cœur est contrôlé avec 5 groupes de barres. Le contrôleur est interfacé avec le code neutronique KISPAC-1D. Un autre exemple, utilisant le code de cinétique neutronique 3D MASTER est disponible dans [55].

3.1.2.5 Logique floue et réseaux de neurones

La logique floue consiste à exploiter la connaissance humaine d’un système, en le contrôlant à partir de règles «SI ALORS» simples et formulées en toutes lettres. Par exemple, dans notre cas, ça pourrait être «SI le réacteur est un peu trop chaud, ALORS insérer le GRT de quelques pas». La difficulté de l’établissement du contrôleur réside avant tout dans l’établissement de cet ensemble de règles.

A partir des données «nettes» de départ, comme la température du cœur, ou l’axial offset, le contrôleur détermine la validité des prédicats flous ("le réacteur est un peu trop chaud") à l’aide de fonctions d’apparte- nance. Cette étape est appelée floutage (fuzzification). Un interprète des règles se charge alors de déterminer les actions floues de sortie («insérer le GRT de quelques pas»). Il faut alors faire la synthèse de ces actions et repasser à des sorties nettes. C’est l’étape de défloutage (defuzzification). Plusieurs méthodes existent pour ces différentes étapes.

Dans [48], Liu, Peng, Zhao et al. utilisent la logique floue afin de déterminer les gains PID à utiliser pour un niveau de puissance donnée. La logique floue va permettre de choisir entre les gains prédéterminés à plusieurs niveaux de puissance, à partir d’un algorithme d’optimisation quadratique génétique. Le contrôleur est testé

sur un modèle de réacteur point. Dans [11], Boroushaki, Ghofrani, Lucas et al. combinent l’intérêt de la prise de décision par logique floue avec un méta-modèle basé sur un réseau de neurones. Le méta-modèle est entraîné sur un logiciel de simulation 3D et permet de prédire les effets 3D des déplacements de barres dans le cœur pour une large gammes de niveaux de puissance. Ces travaux ont permis de proposer une stratégie de pilotage basée sur les barres de contrôle avec des recouvrements variables. Ce contrôleur est testé sur le code de simulation de réacteur DYNCO, sur un réacteur de type VVER (réacteurs à eau pressurisée russes). Dans [32], Khorramabadi, Boroushaki et Lucas utilisent la logique floue et les réseaux de neurones couplés à un apprentissage émotionnel basé sur un signal de stress qualifiant la qualité du contrôle.

3.1.2.6 Contrôle robuste H

∞

La méthode H∞ [9] est une méthode de synthèse de contrôleur optimal. Elle est basée sur la minimisation

d’une norme infinie. Un exemple d’utilisation de la méthode sur le mode T de l’EPR par Lemazurier, Yagoubi, Chevrel et al. est disponible dans [40]. Le modèle de réacteur est linéarisé autour de différents points de fonctionnement de manière à calibrer un contrôleur H∞. La mise bout à bout de ces contrôleurs permet le

contrôle sur une gamme de puissance étendue. Lemazurier, Chevrel, Yagoubi et al. a également utilisé cette méthode pour le contrôle de température des branches froides et chaudes des REP [39].

3.1.2.7 Méthodes avancées de PID

La technologie PID est classiquement utilisée dans les contrôles de réacteur (sur le mode T notamment). La difficulté du PID réside dans le choix des paramètres. Des techniques avancées existent, on a déjà notamment évoqué l’utilisation de la logique floue pour déterminer les gains (voir [48]). Dans [60], une méthode d’adaptation des gains est également proposée, et sa stabilité est vérifiée.

Dans le document Optimisation multi-objectifs du pilotage des réacteurs nucléaires à eau sous pression en suivi de charge dans le contexte de la transition énergétique à l'aide d'algorithmes évolutionnaires (Page 64-67)