Commande prédictive à base de modèle pour le trafic urbain bi-modal

03/08/2016
OAI : oai:www.see.asso.fr:545:2009-2:17213
DOI :

Résumé

Commande prédictive à base de modèle pour le trafic urbain bi-modal

Métriques

50
15
226.35 Ko
 application/pdf
bitcache://c5b903f2b4224898dfb343a3d505938bf154101d

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/545:2009-2/17213</identifier><creators><creator><creatorName>Neïla Bhouri</creatorName></creator><creator><creatorName>Djilali Touazi</creatorName></creator></creators><titles>
            <title>Commande prédictive à base de modèle pour le trafic urbain bi-modal</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2016</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Wed 3 Aug 2016</date>
	    <date dateType="Updated">Wed 3 Aug 2016</date>
            <date dateType="Submitted">Fri 10 Aug 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">c5b903f2b4224898dfb343a3d505938bf154101d</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>28963</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

Commande prédictive à base de modèle pour le trafic urbain bi-modal Neïla BHOURI1, Djilali TOUAZI2 INRETS / GRETIA 2 Avenue du Général Malleret-Joinville, 94114 Arcueil Cedex, France 1 neila.bhouri@inrets.fr, 2 touazi_djilali@yahoo.fr Résumé— Cet article propose une stratégie de régulation du trafic urbain bi-modal. L’objectif de cette stratégie est d’agir sur les durées des feux de la circulation pour réguler le trafic pour les modes de transport de la voiture particulière (VP) et du transport en commun de surface (TC) tout en accordant une priorité active à ce dernier. Cette stratégie consiste en une Commande Prédictive à base de Modèle, appelé MPC (de l’anglais : Model Predictive Control) sera appliquée en horizon glissant. L’originalité du travail proposé consiste en sa manière de tenir compte des contraintes d’égalités et d’inégalités auxquels sont soumis les variables d’état et les variables de commande. En effet, grâce à des changements de variables les contraintes sont considérées d’une manière intrinsèque au problème d’optimisation. La résolution numérique est réalisée grâce à un algorithme d’activation des contraintes. Des simulations ont été effectuées pour tester la stratégie sur un réseau urbain et les résultats sont donnés. Mots-clés—Commande prédictive à base de modèle, MPC, horizon glissant, contraintes linéaires, activation des contraintes, optimisation, linéaire qua- dratique, trafic urbain bimodal, régulation, transport en commun, voiture particulière. I. INTRODUCTION L’un des piliers de l’intermodalité et du transfert modal de la voiture particulière (VP) vers les transports en commun (TC), est d’assurer une qualité compétitive des TC par rapport à la VP. Ceci nécessite de garantir l’offre TC du point de vue de la sécurité, du confort, de l’information et du coût monétaire mais plus important encore d’assurer la régularité du service et la compétitivité des temps de parcours par rapport aux VP. Pour les transports en commun de surface, plus particulièrement les bus, la régularité et le temps de parcours sont tributaires de la charge de trafic sur la voirie et des temps d’attente aux carrefours à feux. On estime qu’entre 20 et 30% du temps est perdu en attente aux feux ou en ralentissement dans la circulation [1]. Plusieurs mesures visant à améliorer les temps de parcours des bus se sont répandues. Parmi celles-ci les sites propres ou les voies réservées aux TC, l’interdiction de stationner sur la voirie, le péage urbain visant à réduire la circulation routière, le guidage statique ou dynamique à l’aide des panneaux à messages variables pour diriger les VP vers des routes moins fréquentées ou moins gênantes pour les TC et la "priorité bus" aux carrefours à feux. La priorité bus aux feux de signalisation peut s’opérer d’une manière passive ou active. La priorité passive consiste à générer les plans des feux de signalisation de manière à favoriser les artères supportant les TC, sans détection individuelle de ces véhicules. Le système de régulation permettant la priorité passive le plus connu est le système TRANSYT [2]. La priorité active ou dynamique, consiste en une modification de la signalisation du carrefour pour autoriser le passage du véhicule TC qui a été détecté. Ce type de priorité est possible sur les systèmes de régulation temps réel du trafic. Plusieurs systèmes existent, nous pouvons citer par exemple les systèmes : CRONOS [3], PRODYN [4], UTOPIA [5], SCOOT [6], SCATS [7] et TUC [8]. Une majeure partie de ces systèmes n’est cependant pas ca- pable de gérer la priorité de plus d’un véhicule de transport en commun par cycle de feux. C’est le cas par exemple des straté- gies TUC, SCOOT, SCATS, etc. En effet, ces stratégies donnent la priorité sur la base de règles. Pour faire passer le véhicule de transport en commun, ces stratégies procèdent soit par prolonga- tion de la durée du feux vert, soit par raccourcissement de la du- rée du feux rouge, soit en appliquant une phase spéciale à l’ap- proche du véhicule et rétablissent l’ordre des phases par la suite. Tous ces types de procédures ne peuvent être répétés plusieurs fois au cours d’un même cycle. Ceci limite donc l’usage de ce type de stratégies aux carrefours qui ne sont pas très fréquen- tés par les véhicules de transport en commun. Les systèmes qui gèrent la priorité par des algorithmes d’optimisation comme par exemple PRODYN, CRONOS, etc peuvent tenir compte de plu- sieurs critères avant d’accorder la priorité. Comme par exemple accorder la priorité au véhicule de transport en commun qui le mérite le plus et non à celui qui la demande en premier, etc. Ce- pendant ces systèmes étant conçus en premier pour la régulation d’un carrefour isolé nécessitent beaucoup de temps de calcul dès qu’il s’agit d’une région possédant un nombre important de car- refours et ne peuvent donc pas gérer le trajet de toute une ligne de TC par exemple. Dans l’objectif de trouver une stratégie de régulation qui favorise d’une manière active la progression des véhicules de transport en commun sur tout un réseau tout en veillant à améliorer les conditions globales de la circulation, nous avons développé la stratégie NeTPrior [9]. NeTprior consiste en une commande linéaire quadratique (LQ) du trafic bi-modal. Elle permet de réguler le trafic sur la totalité d’un réseau urbain en favorisant les arcs sur lesquels les véhicules de transport en commun sont présents aux instants où ils y sont. La résolution du problème de commande optimale par la méthode LQ ne permet cependant pas de tenir compte des contraintes. Pour pallier à ce problème, nous avons procédé dans NeTPrior à une projection des valeurs des commandes qui ne respectent pas les contraintes sur les valeurs les plus proches. Ceci en résolvant le problème d’optimisation de distance minimale pour chaque valeur de la commande en boucle fermée obtenue à la première étape. Les contraintes sur la variable d’état ne sont pas prises e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 en compte dans cette stratégie. D’où l’idée d’avoir une autre démarche de recherche de la commande optimale qui permet cette fois-ci de considérer les contraintes sur les variables de commande et sur les variables d’état. Nous présentons dans cet article cette nouvelle stratégie qui consiste en une commande prédictive. Pour cette première recherche, nous nous sommes basés sur le même fondement que la stratégie NeTPrior, à savoir un modèle linéaire du trafic urbain bi-modal et un critère quadratique. Un changement de variables a été effectué afin de pouvoir tenir compte des contraintes sur les variables d’état et sur les variables de commande. Dans la suite de cet article, après une brève présentation du principe de la commande prédictive à base de modèle, nous consacrerons une section à la présentation du modèle linéaire du trafic bi-modal, puis au critère de performance. Celui-ci consiste en un critère quadratique qui est une fonction du nombre de véhicules sur les arcs, du nombre de véhicules de transport en commun présents sur chaque arc et des durées des feux verts accordées aux différentes phases du réseau. Minimiser le critère revient à obtenir la commande qui permet de réguler le trafic sur la totalité du réseau tout en favorisant les arcs supportant les véhicules TC aux instants où ils y sont. Nous définissons par la suite les contraintes auxquelles sont soumises les variables d’état et les variables de commande. La quatrième section est consacrée à une brève présentation de la stratégie NeTPrior, développée dans un travail antérieur. Ceci dans l’objectif de discuter de ces inconvénients et de signaler l’apport que nous attendons de la nouvelle stratégie MPC. La cinquième section est enfin consacrée aux transpositions du critère et des contraintes dans le modèle de la stratégie MPC, dans l’objectif d’en tenir compte à chaque étape d’optimisation. La sixième section contient la méthode de résolution numérique, à savoir l’algorithme d’activation de contraintes. Enfin avant de conclure, nous donnerons les résultats des tests en simulation de la stratégie sur un réseau de trafic urbain de petite taille. II. COMMANDE PRÉDICTIVE À BASE DE MODÈLE(MPC) La stratégie appelée commande prédictive à base de modèle (MPC) optimise à partir des entrées le comportement futur et anticipé du système considéré. La prédiction est faite à partir d’un modèle du système sur un intervalle de temps fini appelé horizon de prédiction. Le principe de la commande consiste à optimiser à chaque période d’échantillonnage le critère de per- formance J soumis à des contraintes fonctionnelles et à déter- miner la meilleure séquence des Kc commandes sur l’horizon de prédiction K. La première commande de la séquence optimale est alors appliquée et la résolution recommence en prenant en compte les informations disponibles réactualisées (voir figure 1). La répétition de cette procédure à chaque période permet de balayer le temps avec un horizon fini (voir [10] pour plus préci- sion). Vu la variabilité des conditions de circulation, il est important que la stratégie de régulation développée puisse s’appliquer en boucle fermée. Ceci est possible suivant le schéma donné sur la figure 2 III. LE MODÈLE DU TRAFIC URBAIN BI-MODAL Le réseau est représenté par des intersections j ∈ J et des arcs a ∈ A. Le modèle consiste en une équation pour les arcs sur lesquels ne circulent pas les transports en commun et deux équations sur les itinéraires de ces derniers. UUUUoptoptoptopt k 0 1 2 3 UUUUoptoptoptopt k 0 1 2 3 UUUUoptoptoptopt k 0 1 2 3 4 UUUUoptoptoptopt k 0 1 2 3 4 De k=0 à k=1 Horizon de prédictionHorizon de prédictionHorizon de prédictionHorizon de prédiction Fig. 1. Le principe de fonctionnement de MPC en horizon glissant La commande Etat uk Modèle de prédiction Commande MPC Optimiseur (PQ) Système xk+1 ... xk+K Sortie Boucle fermée xk+1 uk+1 ... uk+K x0 K Fig. 2. Commande MPC en boucle fermée A. Le modèle du trafic sur l’arc Le trafic sur chaque arc est modélisé à l’aide de l’équation de conservation du nombre de véhicules. xa(k +1) = xa(k)+T[qa(k)−ua(k)] (1) xa étant le nombre de tous les véhicules sur l’arc exprimé en unité de véhicules particuliers (UVP) (par exemple un bus est équivalent à 2,3 UVP, un deux-roues est équivalent à 0,3 UVP, etc.). qa et ua sont les débits respectivement d’entrée et de sortie de l’arc a sur la période [kT,(k +1)T] où k est un indice de pas de temps et T l’intervalle d’échantillonnage, da est la demande et sa le débit de saturation de l’arc (c’est le débit maximal qui peut quitter l’arc à un instant) exprimés en UVP/seconde (voir la figure 3). Arc b Arc a IM τb,a qa uaxa N M Intersection Intersection Fig. 3. Définition des variables Le débit de sortie de l’arc ua est modélisé suivant la méthode classique introduite par Gazis et Potts en 1963, appelé en anglais "store and forward" : stocke puis distribue, voir [8]. Cette méthode présume que tous les véhicules arrivant sur un arc sont stockés à son extrémité de sortie et le quittent avec un débit maximum sa durant le feu vert : ua =    sa si l’arc a est à la phase verte 0 sinon (2) e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 Cette modélisation est possible sous certaines hypothèses dont la principale est le fait que l’intervalle de temps d’échantillon- nage T est supérieur ou égal à la durée du cycle des feux C. T = C Compte tenu de l’équation (2), pour tout le cycle C, le débit de sortie de l’arc à l’instant kT, est donnée par : ua(k) = Sa.Ga(k) C (3) où Ga(k) est la variable de commande du système : le temps de feu vert accordé à l’arc a durant le cycle de feux C de l’intersection située à la sortie de l’arc. Si la sortie de l’arc se fait durant plusieurs phases de vert différentes, Ga(k) sera égale à la somme des durées des feux verts pour l’ensemble de ces phases : Ga(k) = ∑ i∈Pa j Gj,i(k) (4) où Pa j est l’ensemble des phases du carrefour j durant lesquelles l’arc a a le feu vert. Le débit d’entrée à l’arc a peut s’écrire comme la somme des débits sortant de toutes les branches du carrefour M et qui ont comme destination l’arc a : ∑ω∈IM τω,auω(k), où τω,a est le pourcentage des mouvements des véhicules partant de l’arc ω ∈ IM vers l’arc a. En utilisant cette nouvelle formulation des débits d’entrée et de sortie dans l’équation (1), nous obtenons le modèle suivant : xV a (k +1)=xV a (k)+[∑ ω∈IM τω,aSωGM,ω(k)−Sa ∑ i∈ON GM,i(k)] (5) ou sous forme matricielle : XV (k +1) = I.XV (k)+B.G(k) (6) I étant la matrice identité et B une matrice de dimension N ×M. M est le nombre de phases du réseau M << J. B. Le modèle TC Connaissant la succession d’arcs qui sont empruntés par chaque ligne TC, on modélise la progression des véhicules par une équation de retard : xbi a (k) = xbi a (k −ζi) (7) où xbi a est le nombre de véhicules de la ligne TC numéro bi sur l’arc a. ζi est un paramètre qui exprime le temps de parcours moyen que mettent les véhicules de la ligne bi pour voyager de l’arc a à l’arc a. ζi prend normalement des valeurs réelles. Cependant, pour des raisons évidentes de commande, ζi doit être un multiple de l’intervalle d’échantillonnage T. Nous considérons donc que ζi est égal à un cycle si la ligne de bus n’a pas d’arrêt sur l’arc a, sinon ζi est égal à deux durées de cycle. En substituant ces valeurs ζi dans l’équation (7), le modèle des TC devient le suivant : xbi a (k +1) =    xbi a (k −1), si la ligne TC a un arrêt xbi a (k), Sinon (8) Cette simplification est en accord avec la modélisation de la commande des VP puisqu’elle consiste à supposer qu’aussi bien les VP que les TC sont "stockés" durant la période de feu rouge puis sont "distribués" durant la période de vert ; ils passent donc un cycle de feu sur l’arc. Il faudra cependant, faire attention au choix de la durée du cycle. L’écriture sous forme matricielle de l’équation (8) donne : Xb (k +1) = Ab 0Xb (k)+Ab 1Xb (k −1) (9) ou sous forme canonique XB (k +1) = Ab .XB (k) (10) où XB est le vecteur contenant les états aux instants k de tous les arcs traversés par les TC et des instants k−1 des arcs possédant en plus un arrêt TC. La matrice Ab est donnée par : Ab =     Ab 0 Ab 1 I(Nb,Nb) 0     où I(Nb,Nb) est la matrice identité de dimension [Nb,Nb], Nb étant le nombre d’arcs traversés par les véhicules TC. C. Le modèle global Les équations (6) et (10) donnent la dynamique du système bimodal : X(k +1) = AX(k)+BG(k) (11) Avec le vecteur d’état tX = [tXv(k),t XB(k)] et A la matrice de dimension (N +2Nb) ×(N +2Nb) donnée par : A =     I 0 0 Ab     La matrice B de dimension [N + 2Nb,M] est composé de deux blocs. Le premier est définie par le phasage des carrefours et contient donc la matrice B de l’équation (6). Le deuxième block ne contient que des zeros puisque les véhicules de transport en commun ne sont pas commandable. D. Critère d’optimisation Notre objectif du point de vue régulation du trafic, est de favoriser la progression des TC dans le réseau sans dégrader les conditions globales de circulation. Cet objectif peut être atteint grâce au critère d’optimisation quadratique suivant : min G J(G) = K ∑ k=0 (α(t X(k)Xb (k))+β X(k) 2 +γ G(k) 2 ) (12) où α, β and γ sont des paramètres de pondération non-négatifs et les X sont données par les équations dynamiques (5) et (8). Le premier terme du critère (X(k) Xb(k)) met en évidence les conditions du trafic sur les arcs traversés par les TC précisément au moment où ces véhicules TC s’y trouvent. Le second membre vise à réduire le nombre de véhicules sur chaque arc du réseau, et donc à égaliser la congestion sur tous les arcs. Le rôle de ce second terme est principalement de ne pas améliorer la circulation sur les arcs traversés par les TC au détriment de celle des autres arcs du réseau. Enfin, le dernier terme est utilisé afin d’éviter les grandes variations des variables de commande. e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 Le critère (équation 12) peut s’écrire sous la forme matricielle classique : J(G) = K ∑ k=0 ((t X(k)QX(k))+t G(k)RG(k)) (13) où : Q =     βI(N,N) α 2 I(N,2Nb) α 2 I(2Nb,N) βI(2Nb,2Nb)     R = γI E. Les contraintes La résolution du problème de commande optimale par la méthode LQ ne permet pas de tenir compte des contraintes. Cependant, compte tenu du fonctionnement d’un carrefour, pour chaque carrefour j les durées des feux verts doivent respecter un certain nombre de contraintes : – la durée du cycle (C) – le diagramme de phase : toutes les phases (Pj) doivent avoir leur feu vert à l’intérieur du cycle – les temps de dégagement entre les phases Rj ce qui implique : ∑ i∈Pj Gj,i +Rj = C (14) D’autre part, la durée de chaque feu vert est limitée par un maximum et un minimum. En effet, une durée de feu rouge trop longue sur un courant peut être interprétée par les usagers comme un dysfonctionnement des feux du carrefour et impliquer leur non-respect : Gj,i,min ≤ Gj,i ≤ Gj,i,max (15) De même le nombre de véhicules sur un arc ne peut dépasser la capacité de la route et ne peut prendre des valeurs négatives : Xv min ≤ Xv ≤ Xv max (16) IV. NETPRIOR : STRATÉGIE DE COMMANDE LINÉAIRE QUADRATIQUE Le problème de commande optimale résolu par NeTPrior [11] consiste à minimiser le critère donné par l’équation (13) mais pour un horizon de temps infini, en respectant la dynamique donnée par le système d’équations (6). Utilisant la méthode d’optimisation LQ [12], la loi de commande appliquée est donnée par l’équation suivante : G(k) = GN −R.X(k) (17) où GN est le vecteur de commande nominale et R la matrice de Riccati qui dépend des coefficients du critère : α, β et γ. Notons que le choix d’un horizon de temps infini dans l’équa- tion (13) nous permet d’avoir une matrice de Riccati R indépen- dante du temps. Ce choix se justifie par la volonté d’une com- mande temps réel des feux des carrefours et donc la simplifica- tion des calculs pour chaque commande. Il présente néanmoins l’inconvénient de considérer une moyenne temporelle du critère, ce qui réduit l’importance de notre principal objectif qui est de réduire le nombre de véhicules sur les arcs aux instants où les véhicules TC y sont. C’est pour cette raison que nous ne consi- dérons pas un horizon infini dans la stratégie MPC. Comme nous l’avons signalé à l’introduction, la méthode LQ ne permet pas de tenir compte des contraintes. Nous avons donc résolu ce problème en procédant à une projection des valeurs des commandes qui ne respectent pas les contraintes sur les valeurs les plus proches. Ceci en résolvant le problème d’optimisation donné par l’équation (18) en respectant les contraintes des équations (14) et (15) pour chaque valeur de la commande obtenue. min Gj,i = ∑ i∈Pj (Gj,i −Gj,i)2 (18) Les contraintes sur la variable d’état n’ont donc pas été consi- dérées dans NeTPrior d’où la nécessité de la nouvelle dé- marche qui va nous permettre de tenir compte également de ces contraintes. V. LE MODÈLE MPC Nous résolvons donc ici le problème de commande optimale du système modélisé par l’équation linéaire (11), en minimi- sant le critère quadratique donné par l’équation (13) sous les contraintes linéaires appliquées à la commande (14 et 15) et à la variable d’état (16). Afin de pouvoir inclure les contraintes au moment de la résolution du problème d’optimisation, nous adoptons la méthode qui a été présentée dans [13]. Pour simplifier les notations, re-écrivons les contraintes sous la forme suivante : Uk = {uk : Luk ≤ vu} Xk = {xk : Dxk ≤ vx} (19) L’idée consiste à éliminer la variable d’état X de ce problème. Ceci peut se faire en développant en premier la dynamique : x(k +1) = Ax(k)+Bu(k) sur le temps k allant de 0 à K .    x(1) = A.x(0)+Bu(0) x(2) = A.x(1)+B.u(1) = A2.x(0)+A.B.u(0)+B.u(1) x(3) = A.x(2)+B.u(2) = A3.x(0)+A2.B.u(0)+A.B.U(1)+B.u(2) ... x(K) = AKx(0)+AK−1.B.u(0)+AK−2.B.u(1)+··· ···+A1.B.u(K −2)+B.u(K −1) Ce qui se traduit en notation matricielle par le système : le système (V) ⇐⇒ X = S.U +A.x où : t U = (t u0, u1,··· ,t uK−1); t X = (t x1,t x2,··· ,t xK) t A = (t A,t A2 ,··· ,t AK ) et S est une matrice de dimensions : [K.(N +2Nb)),K.M] S =      B 0 ··· ··· 0 AB B 0 ··· 0 ... ... AK−1B AK−2B ··· AB B      e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 A. Transposition du critère Avec les notations ci-dessus, nous allons ré-écrire le critère (Equation 13) en fonction de la variable de commande U seulement. J = 1 2 t x0Qx0 + 1 2 (t Ax)Q(Ax) constante +1 2 tU (t SQS) H1 U + tU (t SQAx) F +1 2 (tURU) (20) Finalement le critère s’écrit : J = 1 2 t U (t SQS+R) H U + t U (t SQAx) F (21) Avec Q =       Q ··· 0 0 ... ... ... ... 0 ··· Q ... 0 ··· 0 P       et R =    R ··· 0 ... ... ... 0 ··· R    Il est facile de vérifier que si les matrice R et Q sont définies positives alors la matrice H le sera aussi et ne dépend donc pas de la nature des matrices constituant la dynamique. On peut remarquer aussi que dû au fait que les véhicules de transport en commun ne sont pas commandables (matrice B nulle pour toute la partie correspondant à Xb), la matrice H est indépendante du paramètre α, seule la matrice F en dépend. Il faudra donc prendre de très grandes valeurs du paramètre α (α»β) pour accorder de l’importance aux arcs supportant les TC puisque la matrice F exerce un effet moindre sur le critère que la matrice H. B. Transposition des contraintes Si nous posons : tVx = (t vx , t vx ,··· , t vx ) K fois et D = D∗I(K,K) alors {xk : Dxk ≤ vx ; ∀k = 1,··· ,K} peut être transformé en un ensemble ne dépendant que de U ; ce qui s’écrit en notation matricielle comme suit : DX ≤ Vx ⇔ DS.U ≤ Vx −DAx (22) Nous ferons de même pour l’ensemble {uk : Luk ≤ vu ; ∀k = 0,··· ,K −1} et nous obtenons LU ≤ Vu (23) Où L = L.I(K,K) et tVu = ( t vu , t vu ,··· , t vu ) K fois Le problème (QP) qui se dégage est : (QP)    J = 1 2 tUHU + tUF SC DS.U ≤ Vx −DAx LU ≤ Vu (24) Le modèle MPC décrit ci-dessus d’horizon de prédiction K répond à nos objectifs puisque la commande sera appliquée en boucle fermée (voir figure 2) tout en respectant les contraintes intrinsèquement à l’étape d’optimisation, que ce soient les contraintes sur la variable de commande ou sur la variable d’état. D’autre part, la structure du problème le place dans le cadre de l’optimisation quadratique linéaire pour lequel de nombreux outils de résolution numérique existent. En effet, plusieurs algorithmes de complexité polynomiale sont mis au point et peuvent être facilement implémentés pour sa résolution. Nous avons utilisé dans ce travail un algorithme d’activation de contraintes ([14]). VI. ALGORITHME D’ACTIVATION DE CONTRAINTES La méthode d’activation de contraintes procède en considé- rant à chaque étape un certain nombre des contraintes d’inéga- lité comme étant des contraintes d’égalité actives, appelées "en- semble de contraintes actives, les autres contraintes étant dans un premier temps ignorées. La méthode consiste à résoudre d’une manière séquentielle un problème de programmation qua- dratique sous des contraintes d’égalité. A chaque étape, on ré- ajuste l’ensemble des contraintes actives afin d’identifier les contraintes qui interviennent pour la solution optimale [14]. A. Présentation de l’algorithme Écrivons le problème (QP) (équations 24) sous la forme suivante : (QP) :    Minu 1 2 u Hu+u b sous les contraintes : Aiu = bi ∀i ∈ E Aiu ≤ bi ∀i ∈ I (25) H étant définie positive, E est l’ensemble des indices des contraintes égalité et I l’ensemble des indices des contraintes inégalité. Soit Ik = i ∈ I : Aiuk = bi l’ensemble des indices des contraintes inégalité qui sont saturées au point réalisable uk. La méthode d’activation de contraintes trouve l’optimum de (25) par le procédé suivant : A la kme itération on suppose l’existence de la solution réali- sable uk. La méthode va résoudre le problème (QP) en omettant les contraintes non actives. le problème est donc transformé en : (QPr) :    Minu 1 2 u Hu+u b sous : Aiu = bi ∀i ∈ wk (26) où, Wk = E ∪Ik est l’ensemble des contraintes actives Si on pose u = uk +d alors 1 2 u Hu+u b = 1 2 ukHuk +ukb+d (c+Huk)+ 1 2 d Hd avec toujours Aiuk = bi ∀i ∈ wk. Il est facile de voir que résoudre (26) revient à résoudre le problème équivalent suivant : (QPre) :    Mind 1 2 d Hd +d (c+Huk) sous : Aid = 0 ∀i ∈ wk (27) Soient dk la solution optimale de (27) et ν∗i ∀i ∈ wk les coef- ficients optimaux de Lagrange, les conditions de Karush-Kuhn- Tucker (KKT) relativement au problème (27) s’écrivent : Hdk +c+Huk + ∑ i∈wk ν∗i Ai = 0 (28) e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 Akdk = 0 ∀i ∈ wk A ce niveau nous pouvons distinguer deux cas : 1. Cas dk = 0 (a) si ν∗i ≥ 0, ∀i ∈ Ik alors uk est une solution optimale (25), l’algorithme s’arrête ; (b) supposons l’existence de p ∈ Ik tel que ν∗p < 0 alors nous pouvons encore améliorer la valeur du critère de (25) en rendant la pme contrainte inactive. Donc on pose wk+1 = E ∪ Ik+1 avec Ik+1 = Ik − p et uk+1 = uk ; puis résoudre à nouveau (27) 2. Cas dk = 0 (a) si uk + dk est une direction admissible pour le problème (25) alors on pose : wk+1 = wk, uk+1 = uk +dk ; puis résoudre (27) (b) si uk + dk n’est pas admissible pour (25) alors une re- cherche linéaire sera effectuée dans la direction de dk. Notons que uk + dk est admissible pour toutes les contraintes actives puisque Aidk = 0 ∀i ∈ wk ; par conséquent, l’inadmissibilité se trouve parmi les contraintes inactives. Afin de maintenir l’ad- missibilité, nous devons choisir un pas αk ∈ [0,1[ tel que Ai(uk +αkdk) ≤ bi ∀i /∈ Ik avec Aidi > 0 ceci nous amène à choisir αk = Mini/∈Ik:Aidk>0 bi−Aiuk Aidk = bp−Apuk Apdk alors Ik+1 = Ik ∪ {p}, wk+1 = E ∪ Ik+1 et uk+1 = uk + αkdk, ce qui rend la contrainte p active ; enfin résoudre le (27). VII. TESTS EN SIMULATION Dans l’objectif d’évaluer la stratégie MPC, nous avons effec- tué des tests en simulation sur un petit réseau. A. Description du réseau utilisé Le réseau (Figure 4) possède deux entrées (E1) et (E2) et deux sorties (S1) et (S2). Il possède sept intersections J = {1,2,...7} et quatorze arcs A = {1,2,...14}. Les arcs liés directement à une sortie ne sont pas considérés dans la simulation. Le réseau comprend une ligne de transport en commun qui passe par les arcs (1), (4) et (6) (voir les arcs verts sur le réseau de la figure 4). Les véhicules de transport en commun ont un arrêt commercial sur l’arc N2. Le cycle de feux est considéré C = 60 secondes. Le débit sur chacune des deux entrées du réseau (E1) et (E2) est égal à 15 véhicules par cycle de feux. Ce qui, compte tenu du fait que le débit maximum pour quitter un arc est S = 0,4vh/sec, représente un trafic très chargé. Nous considérons de même un trafic initial dense sur tous les arcs du réseau : le nombre de véhicules initial est x0 = 10 véhicules sur chaque arc. Les véhicules de transport en commun arrivent avec une fréquence d’un bus tous les deux cycles de feux. Les arcs traversés par les bus sont considérés comme étant des axes principaux du réseau. La majeure partie du trafic est donc orientée sur ces arcs ; par exemple 80% du trafic entrant en E1 se dirige vers l’arc N1 qui est traversé par un bus. 50% de ce trafic plus 80% de celui entrant par l’entrée E2 se trouve sur l’arc N4 et 100% du trafic de l’arc N4 traversera l’arc N6 avant de sortir par S1 (voir tableau I). 53 13 4 6 11 10 2 1 2 3 4 5 7 6 8 S2S1 E1 E2 14 98 12 1 St Fig. 4. Le réseau de simulation E1 C5 : 10%C1 Phase 1 E1 C2 : 80% Phase 2 E1 C3 : 10% C2 Phase 1 E2 C4 : 80% C1 C4 : 50% Phase 2 E2 C6 : 20% C1 C6 : 50% C3 Phase 1 C4 S1 : 100% Phase 2 C1 S1 : 100% C7 S1 : 100% C4 Phase 1 C2 C3 : 50% C8 C3 : 50% Phase 2 C8 S2 : 50% C2 S8 : 50% C5 Phase 1 C1 C6 : 50% Phase 2 C1 C7 : 50% C6 Phase 1 C2 C8 : 100% Phase 2 C5 C8 : 100% C7 Phase 1 C5 C3 : 100% Phase 2 C8 C3 : 100% C8 Phase 1 C6 C4 : 50% Phase 2 C6 C7 : 50% TABLE I LE PHASAGE ET LES POURCENTAGES DES MOUVEMENTS TOURNANTS DU RÉSEAU B. Analyse des résultats Nous nous sommes intéressés en premier lieu à l’influence de l’horizon de prédiction K sur la qualité de la commande op- timale obtenue. Les résultats ont montré qu’un seul pas K = 1 était suffisant. En effet, nous trouvons les mêmes résultats quelque soit l’horizon de prédiction. Ceci s’explique par le fait que le modèle est évolutif ; il ne tend pas vers une valeur finale connue qui améliore la prédiction. Nous nous sommes intéressés par la suite à l’influence de la variable α du critère (équation 12) sur l’état du trafic, l’objectif étant de fluidifier le trafic sur les arcs sur lesquels circulent les véhicules de transports en commun au moment de leur présence. Les figures 5, 6 et 7 donnent l’état du trafic sur les arcs respectivement 1, 4 et 6 sur lesquels circulent des véhicules de transport en commun. La première partie de la figure donne l’état du trafic optimisé sans priorité pour les transports en commun (α = 0). Dans la deuxième partie, les courbes en bleu donnent l’état du trafic sur l’arc dans le cas où les transports en commun sont favorisés (α = 104) et les courbes en vert donnent les instants de présence des véhicules de transport en commun sur l’arc. Comme nous pouvons le voir sur les secondes courbes, quand la valeur de α est très grande, la stratégie parvient à annuler la file d’attente au moment de la présence du véhicule des transports en commun. Nous pouvons remarquer que pour l’arc 4 sur lequel existe un arrêt commercial et où donc, dans notre e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 cas, un véhicule TC est toujours présent, la file d’attente reste nulle tout au long de la simulation, alors qu’elle augmente beaucoup dans le cas ou α = 0. Ceci a évidement l’inconvénient d’augmenter la file d’attente sur les autres arcs (voir table 1) 0 5 10 15 20 25 30 35 40 0 2 4 6 8 10 12 14 16 18 20 Nombre de véhicules sur l’arc 1 Temps NbVéhicules Résultat de la stratégie sans priotité pour le bus : alpha= 0 0 5 10 15 20 25 30 35 40 0 2 4 6 8 10 12 Temps NbVéhicules Résultat de la stratégie avec priorité pour le bus : alpha=100000 Presence du bus Fig. 5. Etat du trafic sur l’arc 2 0 5 10 15 20 25 30 35 40 7 8 9 10 11 12 13 14 15 suivi d un arc bus 4 Temps NbVéhicules Résultat de la stratégie sans priotité pour le bus : alpha= 0 0 5 10 15 20 25 30 35 40 0 2 4 6 8 10 12 14 16 18 20 Temps NbVéhicules le nbr de véhicules PV 1 si présence TC sinon 0 Fig. 6. Etat du trafic sur l’arc 2 En effet, sur la table (II), nous pouvons remarquer que la congestion globale est plus importante quand le paramètre α est important. Une analyse plus fine des résultats montre que l’amélioration des arcs supportant les transports en commun se fait en retenant le trafic sur les entrées du réseau et non sur sa totalité. C’est le prix à payer pour améliorer la trajectoire des transports en commun. VIII. CONCLUSION Nous avons présenté dans cet article une stratégie de régula- tion du trafic bi-modal de la voiture particulière et des trans- ports en commun de surface. Cette stratégie consiste en une commande en boucle fermée en horizon glissant. Elle se base sur un modèle linéaire du trafic et sur un critère quadratique. L’originalité de la commande réside dans le fait de considérer les contraintes intrinsèquement au problème d’optimisation. La 0 5 10 15 20 25 30 35 40 0 2 4 6 8 10 suivi d un arc bus 6 Temps NbVéhicules Résultat de la stratégie sans priotité pour le bus : alpha= 0 0 5 10 15 20 25 30 35 40 0 2 4 6 8 10 Temps NbVéhicules Avec priorité : alpha= 0 Avec priorité : alpha=100000 HORIZON=1 40pas de simulation Fig. 7. Etat du trafic sur l’arc 2 Type Sans priorité Avec priorité Gain de l’arc (α = 0) (α = 104) Arc 1 TC 536 18 97% Arc 4 TC + arrêt 437 27 94% Arc 6 TC 214 28 87% Arc 13 entrée 579 1977 −241% Arc 14 entrée 891 2783 −212% Réseau total 3830 6006 −56% Réseau sans les entrée 2360 1246 0,47% TABLE II ÉTAT DE LA CONGESTION SUR LE RÉSEAU solution numérique a été obtenue grâce à un algorithme d’acti- vation de contraintes. Du point de vue circulation du trafic rou- tier bi-modal, cette stratégie présente l’avantage de réguler le trafic sur tout un réseau en favorisant les arcs où se trouvent des véhicules de transport en commun et seulement quand ils y sont. Les résultats de simulation montrent que la stratégie ap- porte une bonne amélioration sur les arcs où se trouvent les transports en commun en retenant le trafic sur les entrées du réseau. Des travaux futurs devraient inclure un modèle de tra- fic non-linéaire pour mieux tenir compte de la progression des véhicules de transport en commun dans le réseau. RÉFÉRENCES [1] CERTU Collection. La priorité aux feux pour les véhicules de Transport en Commun. Aménagement et Exploitation de la voirie, 2001. [2] R.A. Vincent, A.I. Mitchell, et D.I. Robertson. User guide to transyt version 8. TRRL Laboratory Report 888, TRRL, 1980. [3] F. Boillot, S. Midenet, et J.C. Pierrelée. Real-life cronos evaluation. Tenth International Conference on Road Traffic Information and Control, number 472, pages 182–186. IEE London, April 2000. [4] J.J. Henry et J.L. Farges. P.t. priority and prodyn. Proceeding of the first World Congress On Applications of Transport Telematics and Intelligent Vehicle Highway Systems, pages 3086–3093, Paris-France, 1994. [5] V. Mauro et C. Di Tranto. Utopia. Proceedings in the 6th IFAC/IFIP/IFORS symposium on control, computers, communications on Transportation, pages 245–252, Paris-France, 1989. [6] P.B. Hunt, D.L. Roberston, R.D. Bretherton, et M.C.Royle. The scoot on- line traffic signal optimization technique. Traffic Engineering & Control, 23 :190–199, 1982. [7] W. Chen, G. Jarjees, et C.R. Drane. A new approach for bus priority at signalised intesections. ARRB Transport Research LTD Conference, 19th, Sydney-Australia, 1998. e-STA copyright 2009 by see Volume 6, N°2, pp 1-8 [8] C. Diakaki, M. Papageorgiou, et K. Aboudolas. A multivariable regulator approach to traffic-responsive network-wide signal control. Control Engieneering Practice, 10 :183–195, 2002. [9] N. Bhouri et P. Lotito. An intermodal traffic control strategy for private vehicle and public transport. 10th Euro Working Group on Transportation, pages 423–428, Poznan-Poland, September 2005. [10] E. F. Camacho et C. Bordons. Model Predictive Control. Advanced Textbooks in Control and Signal Processing. Springer, 2007, Second edition. [11] N. Bhouri et P. Lotito. Régulation du trafic urbain multimodal avec priorité pour les transports en commun. Conférence Francophone de MOdélisation et SIMulation - MOSIM 06, Rabat - Maroc, 3-5 avril 2006. [12] J-C. Culioli. Introduction à l’optimisation. Ellipses, 1994. [13] G.C. Goodwin, M.M. Seron, et J.A. De Dona. Constrained Control and Estimation, an optimisation Approch. 2005. [14] J.F. Bonnans, J. C. Gilbert, C. Lemaréchal, et C.A. Sagastizabal. Nume- rical Optimization, theoretical and practical aspects, volume 2nd Edition. 2006. e-STA copyright 2009 by see Volume 6, N°2, pp 1-8