Identifiabilités, discernabilités et analyse par intervalles

01/10/2017
Publication e-STA e-STA 2003-1
OAI : oai:www.see.asso.fr:545:2003-1:20080
DOI :

Résumé

Identifiabilités, discernabilités et analyse par intervalles

Métriques

21
4
306.31 Ko
 application/pdf
bitcache://3a05f5fcce83d6894b45c415bb08039d237120a5

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/545:2003-1/20080</identifier><creators><creator><creatorName>Luc Jaulin</creatorName></creator><creator><creatorName>Isabelle Braems</creatorName></creator><creator><creatorName>Michel Kieffer</creatorName></creator><creator><creatorName>Eric Walter</creatorName></creator></creators><titles>
            <title>Identifiabilités, discernabilités et analyse par intervalles</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2017</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Sun 1 Oct 2017</date>
	    <date dateType="Updated">Sun 1 Oct 2017</date>
            <date dateType="Submitted">Mon 10 Dec 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">3a05f5fcce83d6894b45c415bb08039d237120a5</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>34097</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

Identifiabilités, discernabilités et analyse par intervalles Isabelle Braems1 , Luc Jaulin2 , Michel Kieffer1 , Eric Walter1 1 Laboratoire des Signaux et Systèmes, CNRS—Supélec—Université Paris-Sud, 3 rue Frédéric Joliot-Curie, 91192 Gif-sur-Yvette, France 2 Laboratoire d’Ingénierie des Systèmes Automatisés, Angers, France Isabelle.Braems@lss.supelec.fr Résumé– On étudie en général l’identifiabilité et la discer- nabilité de modèles en tant que propriétés structurelles, c’est-à-dire que la conclusion obtenue doit être vraie pour presque toutes les valeurs des paramètres. Il existe cepen- dant des modèles très simples pour lesquels aucune conclu- sion d’ordre structurel ne peut être obtenue. L’approche proposée ici étudie l’identifiabilité et la discernabilité pour toutes les valeurs des paramètres dans un espace de re- cherche fixé par l’utilisateur, tout en prenant en compte des contraintes éventuelles liant ces paramètres. A partir d’ou- tils numériques issus de l’analyse par intervalles, il est alors possible d’obtenir des conclusions garanties. Ces méthodes sont appliquées sur des modèles compartimentaux issus de la biologie. Mots-clés– Identifiabilité, discernabilité, identification ga- rantie, analyse par intervalles. I. Introduction Essentielle dans la démarche d’élaboration d’un modèle paramétrique à partir de données expérimentales, l’étape de caractérisation consiste à déterminer une structure de modèle M(·) dont on peut penser qu’elle sera pertinente compte tenu des données expérimentales recueillies —ou à recueillir— sur le système S. Plus particulièrement, si les pa- ramètres à identifier ont un sens physique concret, ou si des décisions doivent être prises en fonction des valeurs numé- riques des estimées obtenues, il est crucial de s’assurer que l’on puisse estimer ces paramètres. Il s’agit alors d’étudier l’identifiabilité de cette structure de modèle M(·). Par ailleurs, le choix même de la structure M(·) est sou- vent difficile et il arrive fréquemment qu’on hésite entre deux structures M(·) et N(·). Déterminer la structure la plus pertinente est au coeur du problème de discernabi- lité entre modèles. Il s’agit ici de déterminer s’il existe des valeurs de vecteurs de paramètres pour lesquelles les com- portements des modèles de structure M(·) et N(·) sont identiques. Les tests d’identifiabilité et de discernabilité peuvent in- tervenir à deux stades du processus de modélisation, selon que les données expérimentales ont été ou non recueillies. Si celles-ci sont disponibles, l’étape de caractérisation est directement liée à la démarche d’identification, et la qualité du résultat est conditionnée par la confiance que l’on peut accorder à l’estimateur. L’utilisation de techniques ensem- blistes garanties permet ainsi de s’assurer qu’aucune valeur acceptable n’a été omise (voir [1]-[3]). Dans toute la suite, nous nous restreindrons au cas où nous cherchons à caractériser l’identifiabilité de la structure M(·) associée au vecteur de paramètres p, et la discerna- bilité de deux structures M(·) et N(·), associées respecti- vement aux vecteurs de paramètres p et q, avant que les données ne soient recueillies. On parle alors d’identifiabilité et de discernabilité a priori. Dans ce cas, aucune valeur de p ou q n’a encore été estimée. L’approche classique consiste alors à étudier ces propriétés en tant que propriétés struc- turelles. Dans ce contexte, l’utilisation des méthodes for- melles facilite grandement les calculs, et peut permettre de fournir des conclusions d’ordre structurel lorsque celles-ci existent. Nous proposons ici une nouvelle approche qui per- met d’obtenir des conclusions garanties quant à l’identifia- bilité et la discernabilité de modèles, même lorsqu’aucune conclusion d’ordre structurel ne peut être établie. Nous rappelons brièvement dans la première partie les grandes étapes de l’étude de l’identifiabilité structurelle d’un modèle. A partir d’un constat de certaines des li- mitations rencontrées, nous proposons une nouvelle no- tion d’identifiabilité, qui permet d’obtenir des conclusions garanties sur le domaine d’appartenance des paramètres fourni a priori par l’utilisateur. La mise en œuvre de tests qui s’appuient sur l’analyse par intervalles est présentée dans la troisième partie. Nous illustrons alors ces méthodes sur quelques exemples issus de la biologie et élargissons cette étude au test de discernabilité entre modèles dans la quatrième partie. II. Approche classique A. Identifiabilité a priori Soit une unique structure de modèle mathématique M(·) dont le vecteur de paramètres est noté p. Il s’agit d’ajuster p de telle sorte que le modèle M(p) puisse rendre compte du comportement du système S à l’étude. Lorsque diffé- rentes valeurs de p conduisent au même comportement ob- servé du modèle, il n’est pas possible d’attribuer une unique valeur numérique au vecteur p. Il pourra alors être envi- sagé de modifier le protocole expérimental de manière à lever cette ambiguïté, en particulier par des techniques de planification d’expérience qualitative [4]. Conférence Internationale Francophone d’Automatique, Nantes, 8-10 juillet 2002 823 Comme aucune donnée expérimentale n’est supposée re- cueillie sur le système S, nous nous plaçons dans un cadre idéalisé, où la forme des entrées et les instants de me- sure sont choisis librement. Nous supposons également l’er- reur de caractérisation nulle. Ceci revient à considérer des données générées par un modèle de structure M(·) pour une valeur p∗ du vecteur de paramètres, évidemment in- connue, mais qu’on suppose appartenir à un domaine P fourni a priori. A partir des données non-bruitées générées par le “système” M(p∗ ), on veut estimer les paramètres du “modèle” M(b p) (voir la figure 1). u ´ (b p) ´ (p¤) “système”M(p¤ ) “modèle” M(b p) Fig. 1. Cadre idéalisé de l’étude d’identifiabilité a priori Pour estimer p∗ , il s’agit de régler b p de manière à assurer que les comportements entrée-sortie de M(b p) et M(p∗ ) sont identiques, ce que nous noterons dans la suite par M(b p) = M(p∗ ). (1) L’identité (1) traduit le fait que les sorties générées par M(b p) sont égales à celles générées par M(p∗ ) quels que soient l’entrée u et l’instant de mesure. Dans ces condi- tions idéalisées, ceci est toujours possible puisqu’il existe toujours la solution b p = p∗ . L’identifiabilité de p ne dépend que du nombre de solu- tions de (1) en b p dans P. Supposons momentanément p∗ numériquement connu. Si l’ensemble S de toutes les solu- tions en b p de (1) est un singleton, alors p est globalement (ou uniquement) identifiable en p∗ . Si S est dénombrable, alors p est localement identifiable en p∗ . Si S n’est pas dé- nombrable, alors p est dit non-identifiable en p∗ . Notons qu’une des composantes pi de p peut être globalement ou localement identifiable même si p est non-identifiable. Comme aucune donnée n’a encore été recueillie, il n’est pas possible d’attribuer une valeur numérique à p∗ . On souhaite donc que les conclusions soient valides quelle que soit la valeur de p∗ dans le domaine de recherche a priori P. Comme il peut exister, dans P, des valeurs de p∗ pour lesquelles le cardinal de S diffère de sa valeur typique, l’ap- proche classique consiste à étudier l’identifiabilité en tant que propriété structurelle. B. Identifiabilité structurelle Une propriété est dite structurelle si elle est vraie pour presque toute valeur des paramètres ; elle peut donc éven- tuellement être fausse sur un sous-espace A de mesure nulle de l’espace des paramètres, appelé ensemble atypique. Ainsi, un paramètre pi est structurellement globalement identifiable (s.g.i.) si, pour presque tout p∗ dans le do- maine a priori P, l’ensemble des solutions en b pi de (1) se réduit au singleton p∗ i . Il est structurellement localement identifiable (s.l.i.) si pour presque tout p∗ dans P, l’en- semble des solutions en b pi de (1) est dénombrable ou fini. Il est structurellement non-identifiable (s.n.i.) si pour presque tout p∗ dans P l’ensemble des solutions de (1) en b pi n’est pas dénombrable. Le vecteur p est s.g.i. ou s.l.i. si toutes ses composantes sont s.g.i. ou s.l.i. La première étape de toute étude d’identifiabilité struc- turelle consiste à établir les équations que doit satisfaire b p pour que (1) soit satisfaite. Un résumé de M(·) est une application rM de P dans Rk telle que ∀(b p, p∗ ) ∈ P×2 , M(b p) = M(p∗ ) =⇒ rM(b p) = rM(p∗ ). (2) Dans certains cas, il est possible de remplacer l’implica- tion (2) par l’équivalence ∀(b p, p∗ ) ∈ P×2 , M(b p) = M(p∗ ) ⇐⇒ rM(b p) = rM(p∗ ). (3) Nous parlerons alors de résumé exhaustif [5]. L’ensemble des solutions en b p de (1) est alors égal à l’ensemble des solutions en b p du système rM(b p) = rM(p∗ ). (4) Suivant les caractéristiques de la structure M(·), diffé- rentes approches permettent d’obtenir une application rM satisfaisant (2) ou (3). Pour les modèles linéaires, l’ap- proche par les paramètres de Markov, l’approche par la transformée de Laplace, ou encore l’approche par “chan- gement de base des états” sont les plus usitées [6]. Pour les modèles non-linéaires, on citera en particulier les ap- proches par linéarisation autour d’un point d’équilibre, par série de Taylor, l’approche par isomorphisme d’états, ou en- fin les méthodes d’algèbre différentielle ([7]-[9]). De nom- breux algorithmes de calcul formel facilitent grandement cette étape de manipulation symbolique [10]. Dans toute la suite, nous supposerons rM disponible et nous restrein- drons au cas où (4) est purement algébrique. Une fois l’application rM obtenue, l’ensemble de tous les vecteurs de paramètres b p satisfaisant (4) est recherché. Afin de s’assurer qu’aucune solution ne peut être perdue, il est fréquent d’avoir recours à la théorie de l’élimination qui permet de triangulariser ce système qu’il est alors possible, du moins en principe, de résoudre en considérant successi- vement des équations polynômiales à une seule inconnue, de façon similaire à celle employée pour résoudre par tri- angularisation des systèmes linéaires. Cette approche peut se révéler inadaptée pour plusieurs raisons. Les premières raisons reposent sur la lourdeur et la complexité des calculs mis en jeu: • il n’est pas toujours possible de traduire (1) à l’aide d’une fonction rM polynômiale, c’est-à-dire manipulable par les algorithmes formels, ou lorsque cette traduction est pos- sible, elle peut aboutir à un problème excessivement com- pliqué à résoudre, • même lorsqu’une fonction rM polynômiale a pu être ob- tenue, les manipulations formelles requises pour obtenir une conclusion peuvent être trop compliquées, • le degré de certains des polynômes monovariables à ré- soudre peut être trop élevé pour qu’une solution analy- tique existe. Il faut alors se résoudre à accepter de perdre la nature formelle de la solution, et à avoir recours à des méthodes de calcul numérique. 824 Conférence Internationale Francophone d’Automatique, Nantes, 8-10 juillet 2002 Enfin, le caractère structurel du test effectué peut s’avé- rer discutable. Le nombre de solutions réelles en b pi (les seules d’intérêt) peut en effet dépendre de la valeur numé- rique de p∗ de sorte qu’aucune conclusion de nature struc- turelle ne peut être établie. L’exemple simple à un pa- ramètre qui suit illustre cette idée. Exemple 1: Soit le modèle à un paramètre p (dont on sait qu’il appartient à P = [−2; 2]), sans entrée et dont l’unique sortie est donnée par η(p) = p(p − 1)(p + 1). (5) M(b p) et M(p∗ ) auront le même comportement entrée- sortie si et seulement si p∗ (p∗ − 1)(p∗ + 1) − b p(b p − 1)(b p + 1) = 0. Suivant la valeur numérique de p∗ , l’ensemble des valeurs possibles pour b p sera un singleton si p∗ ∈] − 2, −a[ ∪ ]a, 2[, un couple si p∗ = a ou p∗ = −a, ou un triplet pour p∗ dans ] − a, a[, où a = 2 √ 3 (voir la figure 2). L’identifiabilité globale n’est donc pas une propriété structurelle sur P. ¥ ´ ¤ ( ) p p¤ - 2 - 2 2 - 4 4 - 6 6 - a a - 1 1 2 Fig. 2. Sortie η du modèle de l’exemple 1 en fonction de p∗ Nous proposons une approche alternative qui s’appuie sur des résultats issus de l’analyse par intervalles. III. Approches numériques garanties Il s’agit d’effectuer une étude d’identifiabilité sous con- traintes, sans pour autant imposer une valeur numérique précise à p∗ . Ceci nous conduit à proposer la définition suivante : Définition 1: Le paramètre pi est globalement identi- fiable sur P (g.i.i.P) si ∀(p∗ , b p) ∈ P×2 , M(p∗ ) = M(b p) =⇒ p∗ i = b pi. Le vecteur de paramètres p sera dit g.i.i.P si toutes ses composantes pi, i = 1, .., dim p, sont g.i.i.P. Si la proposition ∃(b p, p∗ ) ∈ P×2 , M(b p) = M(p∗ ), kb p − p∗ k∞ > 0, (6) est fausse, alors p est g.i.i.P. En pratique, l’expérimentateur peut relaxer la contrainte inégalité de (6) en définissant une distance δ en-dessous de laquelle il ne peut —ou ne souhaite— séparer deux valeurs numériques. La quantité δ représente alors l’incertitude mi- nimale admise par l’expérimentateur. Ceci suggère la défi- nition suivante : Définition 2: Soit δ une constante positive fixée par l’uti- lisateur. Si la proposition ∃(b p, p∗ ) ∈ P×2 , M(b p) = M(p∗ ), kb p − p∗ k∞ ≥ δ, (7) est fausse, alors M(·) est dit δ-g.i.i.P. Ces définitions n’autorisent plus l’existence de régions atypiques et soulignent l’importance de l’espace de re- cherche P. Remarque 1: La δi-identifiabilité d’une composante pi s’obtient directement en remplaçant la contrainte de distance kb p − p∗ k∞ ≥ δ par |b pi − p∗ i | ≥ δi. La définition 2 permet d’écrire le test d’identifiabilité globale sur P sous la forme d’un problème de satisfaction de contraintes (CSP) ayant pour variables les composantes du vecteur étendu pe défini par pe = µ pe 1 pe 2 ¶ = µ p∗ b p ¶ , (8) ces variables doivent satisfaire les contraintes (pe 1i − pe 2i ≤ δi) ∨ (pe 1i − pe 2i ≥ δi), (9) rM(pe 1) − rM(pe 2) = 0, (10) pour tout i = 1, . . . , dim p. L’ensemble S des valeurs de pe dans P×2 qui satisfont les contraintes (9) et (10) est appelé ensemble solution du CSP. S contient donc l’ensemble des couples (p∗ , b p) solutions de (7). L’algorithme de partition- nement SiviaP ([3], p. 111), issu des techniques d’analyse par intervalles et de propagation de contraintes [11], per- met d’obtenir un encadrement garanti de S à l’aide de deux unions finies de pavés S et S : S ⊂ S ⊂ S. (11) Un paramètre ε, à régler par l’utilisateur, fixe la taille maximale des pavés encore indéterminés qui sont systéma- tiquement inclus dans S. De ce fait, ε réalise un compromis entre la qualité de la description (11) et le temps de calcul. Pour une valeur de ε fixée, SiviaP fournit en particulier un ensemble S dont la projection sur P permet de déduire les domaines [p] sur lesquels on n’a pas pu prouver que p était δ-g.i.i.[p]. Dans la suite, nous nous intéresserons alors à vérifier si S est vide. Dans ce cas, S est vide, la proposi- tion (7) est fausse et le vecteur de paramètres p est δ-g.i.i.P avec δ = maxi δi. De plus, les techniques de propagation de contraintes employées peuvent permettre de conclure sans aucune bissection, ce qui permet de traiter des modèles δ- g.i.i.P à nombre de paramètres relativement important en des temps de calcul très faibles. Exemple 2: Considérons à nouveau le modèle de l’exemple 1. En 10−3 s sur un Pentium 350, les techniques de propagation de contraintes ont permis de prouver que M(·) est δ-g.i.i.P1, pour δ = 0.02 (voir la figure 3), mais ne peuvent pas permettre de tirer de conclusions quant à sa- voir si M(·) est δ-g.i.i.P2. Le sous-pavage S (représenté en noir) est fourni par l’algorithme lorsque le nombre maximal de bissections est fixé à 14. Il se compose donc de toutes les boîtes [pe ] de P×2 sur lesquelles on n’a pas pu prouver que (9) et (10) ne pouvaient pas être satisfaites. S est donc une approximation extérieure de l’ensemble S des valeurs de (b p, p∗ ) pour lesquelles M(·) n’est pas globalement identifiable, Conférence Internationale Francophone d’Automatique, Nantes, 8-10 juillet 2002 825 de sorte que M(·) est δ-g.i.i.[p] pour toute boîte [p] telle que S∩[p]×2 = ∅. On vérifie bien que S contient l’ensemble S, défini ici par le système ½ |b p − p∗ | ≥ δ (b p + p∗ )2 − b pp∗ = 1. (12) L’approximation extérieure S peut être affinée en auto- risant un nombre de bissections plus élevée. ¥ 2 2 - 2 - 2 P P £ 1 1 P P 2 2 £ P P £ S P1 P2 Fig. 3. Sous-pavage S obtenu par SiviaP pour l’exemple 2. Remarque 2: P n’est souvent pas égal à Rdim p en rai- son de contraintes dues à la nature physique de p. Par exemple, on peut imposer pour des modèles compartimen- taux que tous les coefficients d’échange soient positifs. Ces contraintes (ou d’autres proposées par l’expérimentateur) sont aisément prises en compte dans l’algorithme. Elles permettent une étude a priori, sans avoir à recueillir des données. Les exemples traités ci-dessous, issus de la biolo- gie, illustrent ce propos. Exemple 3: La distribution de la Glafénine administrée oralement peut être décrite par le modèle à trois compar- timents représenté sur la figure 4. Les lois de conservation 1 2 3 u p q 4 3 (p q 7 3) p q 1 1 p q 3 2 p q 5 2 p q 2 1 (p q 6 2) Fig. 4. Modèle de la distribution de la Glafénine. de la matière permettent d’établir le système d’équations différentielles suivant : M(p) :            q̇1 = −(p1 + p2)q1 + u, q̇2 = p1q1 − (p3 + p5)q2, q̇3 = p2q1 + p3q2 − p4q3, η1 = p6q2, η2 = p7q3. q1(0) = 0, q2(0) = 0, q3(0) = 0, (13) L’identité des comportements de M(b p) et M(p∗ ) se réé- crit sous la forme de (8) où les composantes de rM(p) sont les coefficients de la matrice de transfert sous forme ca- nonique associée à (13). Pour P = [0.6; 1]×7 et δ = 10−9 , SiviaP trouve en 0.01s que le modèle est δ-g.i.i.P. Remar- quons que pour P = R7 , le modèle est structurellement non-identifiable [4]. ¥ L’exemple suivant montre les performances de la mé- thode dans un cadre contraint. Exemple 4: La Vincamine est un vasodilatateur utilisé dans le traitement de troubles circulatoires. Sa distribu- tion dans le corps humain est couramment modélisée par des mécanismes de transfert entre quatre compartiments, représentés sur la figure 5. La quantité qi de Vincamine 1 2 3 4 u2 u1 ( ) p p q 7 4 3 - p q 4 3 p q 1 1 p q 3 2 p q 5 4 p q 2 1 ( ) p p q 8 5 4 - p q 6 2 Fig. 5. Modèle compartimental de la distribution de la Vincamine dans le compartiment 1 et le débit sortant du comparti- ment 2 vers l’extérieur sont mesurés. L’équation d’état du modèle s’écrit : . q = Aq + Bu η = Cq avec A =     −(p1 + p2) p3 p4 p5 p1 −(p6 + p3) 0 0 0 0 p7 0 0 0 0 p8     ; B =     1 0 0 0 0 1 0 0    ; C = µ 1 0 0 0 0 p6 0 0 ¶ . Plusieurs méthodes permettent d’établir un résumé exhaus- tif du comportement entrée-sortie du modèle. Avec l’ap- proche par transformée de Laplace, il est possible d’établir que l’union des hyperplans définis par U : ½ ∀i ∈ {1, ..., 8} pi = 0 p7 = p8 appartient à l’ensemble atypique A des valeurs de p pour lesquelles les conclusions structurelles ne sont pas valides. L’égalité des coefficients des matrices de transfert écrites sous forme canonique fournit un système de 25 équations à 16 inconnues, qui constitue les contraintes égalités de C. On vérifie bien qu’à condition d’inclure dans C la contrainte supplémentaire p7 6= p8, les techniques de propagation de contraintes permettent de montrer en 25 × 10−3 s pour 826 Conférence Internationale Francophone d’Automatique, Nantes, 8-10 juillet 2002 δ = 0.01 que le système est incompatible en prouvant que l’ensemble S =    (p∗ , b p) | (rM(p∗ ) = rM(b p)) ∧(p∗ 7 6= p∗ 8) ∧ (b p7 6= b p8) ∧(kp∗ − b pk∞ > δ)    est vide, pour P quelconque tel que 0 / ∈ Pi, i = 1, ..., 8. Les résultats obtenus permettent de conclure que pour tout P tel que P ∩ U = ∅, le modèle étudié est δ-g.i.i.P. Ici, on a donc A = U. ¥ L’extension naturelle de ces travaux au contexte de la discernabilité de deux modèles [12] est présentée dans le paragraphe suivant. A la notion de discernabilité structu- relle est substituée la notion de discernabilité sur P, que nous traitons à nouveau à l’aide d’outils numériques ga- rantis. IV. Discernabilité On considère maintenant deux structures de modèles M(·) et N(·) associées respectivement aux vecteurs de pa- ramètres p et q. Notons que p et q peuvent ne pas être de même dimension. Ces deux structures entrent en compéti- tion pour la description d’un même système S. On dira que N(·) est structurellement discernable (s.d.) de M(·), si pour presque toute valeur de p dans P, il n’existe aucune valeur q dans Q satisfaisant (17). Notons que contrairement à l’identifiabilité, cette définition n’est pas symétrique : la proposition “ N(·) est structurellement discernable de M(·)” n’entraîne pas nécessairement “M(·) est structurellement discernable de N(·)”. Lorsque les deux assertions sont vérifiées, on dira que M(·) et N(·) sont structurellement discernables. Les algorithmes de test de discernabilité structurelle [13] sont analogues à ceux employés pour l’identifiabilité. L’exemple suivant illustre à nouveau un cas où aucune conclusion d’ordre structurel ne peut être obtenue. Exemple 5: Considérons les deux fonctions de transfert du deuxième ordre à coefficients réels M(p) : F(p, s) = 1 s2 + p1s + p2 (14) N(q) : G(q, s) = 1 (s + q1)(s + q2) (15) G(q, s) est discernable de F(p, s) si et seulement si F(p, s) a des pôles complexes conjugués, c’est-à-dire si et seulement si p2 1 − 4p2 ≤ 0. (16) Suivant que p satisfait ou non la condition (16), N(q) sera ou non discernable de M(p), sans qu’aucune des deux si- tuations ne corresponde à une hypersurface atypique. Lors- qu’il est possible de donner un espace de recherche a priori pour l’ensemble des paramètres à estimer, on peut fournir une nouvelle définition de la discernabilité analogue à ce qui a été fait pour l’identifiabilité. On dira que M(·) et N(·) sont globalements discernables sur P × Q, s’il n’existe aucune valeur de p dans P et q dans Q satisfaisant M(p) = N(q). (17) Dans ce contexte, il n’est plus nécessaire d’introduire une dissymétrie dans la définition. A nouveau, cette propriété peut être testée simplement à l’aide d’algorithmes de propagation de contraintes. Soit S l’ensemble solution du CSP ayant pour variables p et q qui doivent satisfaire les contraintes p ∈ P, q ∈ Q, rN (q) − rM(p) = 0. (18) M(·) et N(·) sont globalement discernables sur P × Q si et seulement si S = ∅. Les sous-pavages S et S obtenus par SiviaP permettent de conclure dans les cas suivants : • S = ∅ ⇒ S = ∅ ⇒ M(·) et N(·) sont globalement discer- nables sur P × Q; • S6= ∅ ⇒ ∃ (p, q) ∈ P × Q | M(p) = N(q) ⇒ M(·) et N(·) ne sont pas globalement discernables sur P × Q. Illustrons ces résultats sur les modèles de l’exemple précédent. Exemple 5 (suite) Considérons à nouveau les fonctions de transfert (14) et (15). Avec P = Q = [−20; 20] × [−100; 100] , SiviaP montre que S 6= 0, M(·) et N(·) ne sont pas globalement discernables sur P × Q. Les projec- tions projPS et projQS de S sur P et Q (voir la Figure 6) permettent de comprendre la situation : l’ensemble S est délimité par les inégalités            (i) p2 1 − 4p2 > 0 (ii) q1 + q2 ∈ [−20; 20] (iii) q1q2 ∈ [−100; 100] (iv) p1 = q1 + q2 (v) p2 = q1q2 . Comme ni S ni son complémentaire ne sont de mesure nulle, la discernabilité n’est pas une propriété structurelle pour ces modèles. V. Conclusions L’étape de caractérisation, et en particulier le test d’iden- tifiabilité, est incontournable dans au moins trois types de situations: • lorsque les paramètres dont on veut estimer une valeur numérique ont un sens physique (modèles de connaissance), • lorsqu’il s’agit d’estimer à partir d’un vecteur de données des variables d’état non directement accessibles à la mesure et possédant un sens physique, • lorsque les valeurs numériques des paramètres ou des va- riables d’état à estimer participent à une prise de décision. On distingue alors deux méthodologies, suivant que les données ont ou non déjà été recueillies. En testant l’iden- tifiabilité a priori des paramètres, on espère obtenir une conclusion qui soit aussi indépendante que possible de la valeur p∗ du vecteur des paramètres du modèle supposé avoir généré les données. A partir de cette conclusion, on modifiera ou non le plan d’expériences (en déplaçant les capteurs par exemple) de façon à améliorer l’identifiabilité [4]. Alors que l’approche standard consiste à espérer obtenir des conclusions qui ne soient fausses que pour certaines va- leurs du vecteur de paramètres jugées atypiques, la notion d’identifiabilité globale sur un domaine P permet de four- nir une conclusion garantie, en particulier lorsqu’aucune Conférence Internationale Francophone d’Automatique, Nantes, 8-10 juillet 2002 827 -20 100 20 -100 -20 100 20 -100 a) b) Fig. 6. Sous-pavage S obtenu par SiviaP en 2 s, projeté sur Q (a) et sur P (b). Les espaces de recherche P et Q sont pris égaux à [−20; 20] × [−100; 100]. conclusion d’ordre structurel ne peut être obtenue. Nous avons montré qu’à l’aide des techniques de calcul garanti, il est désormais possible de proposer des outils fiables ca- pables de tester des propriétés pour toutes les valeurs du vecteur de paramètres prises dans un ensemble fourni a priori. Ceci a alors permis de proposer un algorithme com- plètement numérique capable de fournir une réponse ga- rantie à ce problème et de prendre en compte facilement des informations a priori sur les paramètres. L’avantage de ces notions dans un contexte expérimental a été souli- gné. Bien qu’une étude théorique de complexité reste à ac- complir, notons que le problème est considérablement plus simple quand l’ensemble S à caractériser est vide, c’est-à- dire lorsque le modèle est globalement identifiable sur P ou lorsque la paire de modèles est globalement discernable sur P × Q. L’étude envisagée, effectuée avant toute saisie de données, se place dans un cadre idéalisé. Si les données ont déjà été recueillies, la question d’actualité est alors de déterminer l’ensemble de toutes les valeurs du vecteur de paramètres compatibles avec les données et l’information disponible sur le bruit entachant ces données. Dans ce cas, les algorithmes ensemblistes garantis de l’analyse par in- tervalles fournissent également des outils intéressants, en permettant en particulier d’identifier des paramètres qui ne sont pas globalement identifiables [3] [14]. Références [1] M. Kieffer and E. Walter. Interval analysis for guaranteed non- linear parameter estimation. In A. C. Atkinson, L. Pronzato, and H. P. Wynn, editors, MODA 5-Advances in Model-Oriented Data Analysis and Experiment Design, pages 115—125. Physica- Verlag, Heidelberg, Germany, 1998. [2] I. Braems, F. Berthier, L. Jaulin, M. Kieffer, and E. Walter. Guaranteed estimation of electrochemical parameters by set in- version using interval analysis. Journal of Electroanalytical Che- mistry, 495(1): 1—9, 2001. [3] L. Jaulin, M. Kieffer, O. Didrit, and E. Walter. Applied Interval Analysis. Springer-Verlag, London, 2001. [4] E. Walter and L. Pronzato. Qualitative and quantitative experi- ment design for phenomenological models, a survey. Automatica, 26: 195—213, 1990. [5] E. Walter and Y. Lecourtier. Unidentifiable compartmental mo- dels: What to do? Math. Biosci., 56: 1—25, 1981. [6] E. Walter. Identifiability of state space models. Springer-Verlag, Berlin, Germany, 1982. [7] F. Ollivier. Le problème de l’identifiabilité structurelle globale : approche théorique, méthodes effectives et bornes de complexité. Thèse de doctorat, Ecole Polytechnique, 1990. [8] M. Petitot. Quelques Méthodes de Calcul Formel Appliquées À L’étude Des Équations Différentielles. Habilitation à diriger des recherches, Université de Lille, 1999. [9] F. Berthier, J.-P. Diard, L. Pronzato, and E. Walter. Identifiabi- lity and distinguishability in electrochemistry. Automatica, 32: 973—984, 1996. [10] J.A Jacquez and T. Perry. Parameter estimation - local iden- tifiability of parameters. Amer. J. Physiol., 258: E727—E736, 1990. [11] L. Jaulin, M. Kieffer, I. Braems, and E. Walter. Guaranteed nonlinear estimation using constraint propagation on sets. In- ternational Journal of Control, 74(18): 1772—1782, 2001. [12] E. Walter, Y. Lecourtier, and J. Happel. On the structural output distinguishability of parametric models and its relation with structural identifiability. IEEE Transactions on Automatic Control, 29: 56—57, 1984. [13] M. J. Chapman, K.R. Godfrey, and S. Vajda. Indistinguishabi- lity for a class of nonlinear compartmental models. Math. Bios- ciences, 119: 77—95, 1994. [14] I. Braems, L. Jaulin, M. Kieffer, and E. Walter. Guaranteed numerical alternatives to structural identifiability testing. Pro- ceedings of the 40th IEEE Conference on Decision and Control, pages 3122—3128, 2001. 828 Conférence Internationale Francophone d’Automatique, Nantes, 8-10 juillet 2002