Filtrage de bioprocédé de dépollution. Approche par convolution particulaire

30/09/2017
Publication e-STA e-STA 2005-1
OAI : oai:www.see.asso.fr:545:2005-1:20026
DOI :

Résumé

Filtrage de bioprocédé de dépollution. Approche par convolution particulaire

Métriques

16
4
253.9 Ko
 application/pdf
bitcache://569160cffb5e1ad192d0d89e8d7e508a4679a07b

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/545:2005-1/20026</identifier><creators><creator><creatorName>Jean-Pierre Vila</creatorName></creator><creator><creatorName>Vivien Rossi</creatorName></creator></creators><titles>
            <title>Filtrage de bioprocédé de dépollution. Approche par convolution particulaire</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2017</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Sat 30 Sep 2017</date>
	    <date dateType="Updated">Sat 30 Sep 2017</date>
            <date dateType="Submitted">Thu 19 Apr 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">569160cffb5e1ad192d0d89e8d7e508a4679a07b</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>34042</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

Filtrage de bioprocédé de dépollution. Approche par convolution particulaire. Vivien Rossi, Jean-Pierre Vila Laboratoire d’Analyse des Systèmes et Biométrie, UMR INRA/ENSAM 2 Place Pierre Viala, 34060 MONTPELLIER CEDEX 1, France rossiv@ensam.inra.fr, vila@ensam.inra.fr http://www.inra.fr/bia/recherche/unites/montpellier Résumé— Nous étudions le problème du filtrage d’un bioprocédé de dépollution. Ce procédé, de type digestion anaérobie, se déroule dans un bioréacteur de traitement, en temps continu, d’eaux usées. Les capteurs du dispositif ne permet- tant pas de mesurer toutes les variables d’état nécessaires au contrôle du réacteur, elle doivent être estimées. Les procédures de filtrage permettent de réaliser ce type d’opération. Cependant, le modèle considéré n’est pas linéaire, or les outils de filtrage non linéaire classiques connaissent quelques défaillances et ne gèrent pas rigou- reusement les modèles avec des paramètres inconnus. Nous avons donc développé une méthode originale à base de noyaux de convolution s’inspirant des filtres particulaires. Ces méthodes de filtrage stochastiques ont l’avantage d’être insensibles aux non linéarités et de plus, celles que nous pro- posons s’adaptent en toute rigueur aux modèles contenant des paramètres inconnus. Mots-clés—Bio-procédé de dépollution, Filtrage non linéaire, filtres particulaires, noyaux de convolution. I. Introduction Les bioprocédés de dépollution consistent en la transfor- mation au sein d’un réacteur de matières organiques (sub- strats), par des organismes vivants (biomasses). Il est fréquent que les capteurs à disposition, souvent d’un coût prohibitif, ne mesurent que certaines des variables (concentrations) nécessaires au contrôle. Il est alors indis- pensable d’estimer ces dernières, compte tenu du modèle du procédé, c’est à dire de réaliser une opération de filtrage sur les variables de sorties mesurables. Cette opération est aussi souvent appelée reconstruction d’état du système dy- namique. Nous étudions ce problème d’estimation de l’état du système pour un procédé de traitement d’eaux usées. Dans un premier temps, nous présentons ce bioprocédé de dépollution. Nous présentons ensuite notre procédure de filtrage par convolution, sa comparaison avec d’autres procédures de filtrage non linéaires et enfin, son application au modèle du bioprocédé sous des conditions d’observation différentes, grâce à des simulations appropriées. II. Le bioprocédé de dépollution Il s’agit d’un procédé de type digestion anaérobie modélisée par une approche bilan-matière. A. Modélisation de la bioréaction Ce modèle est de conception récente (Bernard & al. [1]). Il est utilisé au Laboratoire de Biotechnologie de l’Envi- ronnement (LBE) de l’INRA à Narbonne. Une description détaillée du réacteur et des capteurs est réalisée par Steyer & al.([13]). Le modèle :                    Ḃ1 = (µ1 − αD)B1 Ḃ2 = (µ2 − αD)B2 Ż = D(Zin − Z) Ṡ1 = D(Sin 1 − S1) − k1µ1B1 Ṡ2 = D(Sin 2 − S2) + k2µ1B1 − k3µ2B2 ĊT I = D(Cin T I − CT I ) + k4µ1B1 + k5µ2B2 −QCO2 (1) Dans la suite, tous les traitements numériques sont réalisés avec une version discrétisée, selon le schéma d’Eu- ler, de ce modèle d’EDO. B. Description des variables Toutes les variables d’état sont des variables de concen- trations : B1 Concentration en bactérie acidogène. B2 Concentration en bactérie méthanogène. Z Concentration dans le milieu en ions fort. S1 Concentration en demande chimique d’oxygène. S2 Concentration en acides gras volatils. CT I Concentration totale de carbone inorganique. D Taux de dilution. QCO2 Débit de CO2. Les variables B1, B2 sont relatives aux biomasses. S1 et S2, sont relatives aux substrats. Les deux variables restantes Z et CT I servent d’indicateurs de l’état du bioréacteur. Comme elles sont mesurables, elles peuvent être utiles en filtrage. D est la variable de contrôle. QCO2 est une variable de sortie. C. Les lois de croissance des bactéries Les taux de croissance µ1 et µ2 des biomasses sont modélisés respectivement par des lois de Monod et d’Hal- dane ([11]) : µ1 = µmax1 S1 KS1 + S1 et µ2 = µmax2 S2 KS2 + S2 + ( S2 KI )2 avec µmax1 = 1.2 Tx de croissance max des biomasses B1. µmax2 = 0.7 Tx de croissance max des biomasses B2. KS1 = 7.1 Paramètre de saturation du substrat S1. KS2 = 25 Paramètre de saturation du substrat S2. KI = 16 Constante d’inhibition associé à S2. D. Description des paramètres Comme pour le modèle, les valeurs des paramètres inter- venant dans le système sont justifiés par Bernard & al.([1]) : α = 0.5 proportion du taux de dilution relatif à l’hétérogénéité du procédé. k1 = 42.14 rendement de conversion S1 → B1. k2 = 116.5 rendement de conversion S1 → B2. k3 = 268 rendement de conversion S2 → B2. k4 = 50.6 rendement de conversion S1 → CO2. k5 = 343.6 rendement de conversion S2 → CO2. k6 = 453 rendement de conversion S2 → CH4. Les variables d’état d’intérêt sont les substrats S1, S2 et à un degré moindre les biomasses B1, B2. Leurs mesures en ligne sont délicates. Des capteurs permettent de mesu- rer les variables Z et CT I et avec encore plus de fiabilité le débit de gaz du bioréacteur Qgaz et le pH du milieu. Il s’agit donc d’estimer S1, S2, B1 et B2 connaissant au moins certaines des quatres variables précédentes. C’est un problème de filtrage. Il est d’autant plus délicat ici que le modèle n’est pas linéaire, les variables B1, B2 ne sont pas mesurables et S1, S2, B1 et B2 ne sont pas observables (non unicité de la solution). Dans l’opération de filtrage, nous avons à comparer les valeurs Z, CT I , pH et Qgaz mesurées, à celles calculées à partir du modèle. Les valeurs calculées de Z et CT I sont directements données par le modèle. Pour le pH, on peut utiliser une équation relative à l’équilibre sur le carbone. Ainsi, à chaque un instant t, le pH du réacteur est donné par pH(t) = − log  Kco2(CT I(t) − Z(t) + S2(t)) Z(t) − S2(t)  / log 10 Où Kco2 = 4, 9.10−7 est la constante de dissociation. La calcul du débit de gaz Qgaz est plus compliqué. Ce débit est la somme du débit de gaz carbonique (CO2) dégagé et de celui du méthane (CH4) : Qgaz(t) = QCO2 (t) + QCH4 (t). Le débit de méthane dégagé peut se calculer par : QCH4 (t) = kk9(t)qCH4 (t)/1000/24 Où qCH4 (t) = V k6 µ2(t) B2(t) et kk9(t) = RT/Pt(t) (RT constante gaz parfaits). V désigne le volume du réacteur et Pt désigne sa pression mesurée en ligne. Pour le débit de CO2 dégagé : QCO2 (t) = kla(CT I(t) + S2(t) − Z(t) − Kh Pc(t)) Où Kh = 16, constante de Henry, kla = 19.8, échange CO2 dissous-gazeux par jour spécifique à ce réacteur. Pc s’obtient à l’aide des deux équations suivantes : Pc(t) = φ(t) − p φ(t)2 − 4Kh Pt(t)(CT I (t) + S2(t) − Z(t)) 2Kh et φ(t) = C(t) + S2(t) − Z(t) + Kh Pt(t) + k6µ2(t)B2(t) kla III. Filtrage du bioprocédé Après un bref rappel sur le filtrage non linéaire nous présentons l’algorithme de filtrage par convolution de par- ticules que nous avons développé. A. Le problème du filtrage Soit le système à temps discret  xt = ft(xt−1, εt) yt = ht(xt, ηt) (2) avec : - xt ∈ IRs variables d’état non observées - yt ∈ IRd variables d’observation - εt bruits blancs du modèle d’état - ηt bruits blancs du modèle d’observation. Les bruits blancs sont indépendants des autres variables, ils servent à modéliser les aléas du système. L’objectif est d’estimer les variables d’états non observées, xt connaissant yt = y1, · · · , yt, les valeurs des variables d’observation jusqu’à l’instant t. Comme le système dy- namique est bruité, il n’est pas possible de déterminer précisément la valeur de l’état xt, on cherche alors à cal- culer la densité de probabilité conditionnelle p(xt|yt ) (le “filtre optimal”) ou plus simplement l’espérance condition- nelle E[xt|yt ], ou encore le mode de p(xt|yt ). Dans le cas où les fonctions ft et ht sont linéaires et les bruits blancs additifs et gaussiens le problème a été résolu par Kalman[6] en 1960. Pour des fonctions ft et ht non linéaires le problème n’a pas de solution standard. Le filtre de Kalman étendu (EKF) (cf. Jazwinski [5]), une généralisation empirique par linéarisation itérative du modèle, est la méthode la plus fréquemment utilisée. Son comportement étant imparfait, la recherche sur ce problème est restée très active. En nous limitant aux méthodes les plus récentes, on trouve les approches neuronales et les approches par simula- tions de particules. Les premières ( Haykin [4], Yee [14] ou Lo [9]) basées sur des réseaux neuronaux nécessitent la disponibilité d’un grand échantillon d’apprentissage {(xi t, yi t)t=1,···,T }i=1,···,n alors que de part la nature du problème, les xt ne sont pas observés facilement. Les approches par filtres particulaires utilisent uniquement la connaissance du système (2). Elle respectent ainsi l’es- prit du problème. De plus, elles s’appuient sur de nombreux résultats théoriques (cf. Del Moral & al. [3]). Mais elles peuvent présenter certains défauts de comportement en pratique. Une étude détaillée est réalisée par Oudjane([10]). La méthode que nous proposons dans la suite est proche des filtres particulaires mais s’en distingue par le type de pondération utilisée et par son allègement des hypothèses sur le modèle. B. Les avantages des filtres par simulations stochastiques Il y a plusieurs avantages à utiliser une méthode sto- chastique pour faire du filtrage. Tout d’abord, le fait que le modèle soit linéaire ou non linéaire n’affecte pas les pro- priétés de convergence vers le filtre optimal. De plus, les problèmes de non observabilité ne sont pas perçus comme dans les approches déterministes. Le filtre optimal, i.e. la densité de probabilité de l’état connaissant les observations p(xt|yt ), existe toujours et il est toujours possible de l’es- timer même si cette densité est peu informative. Les ap- proches déterministes par observateurs standard n’offrent pas l’équivalent. Les filtres par convolution que nous présentons ci-dessous (cf. Rossi & Vila [12]), possèdent en plus la propriété de s’adapter en toute rigueur aux modèles incertains. C. Filtre par noyau de convolution pour un système dyna- mique quelconque Avant de continuer précisons les objets supposés connus, à chaque instant t, dans le système (2) : - π0 la distribution de probabilité de l’état initial x0 - ft la fonction d’évolution du modèle d’état - ht la fonction d’observation - Lε,t la loi de probabilité du bruit sur le modèle d’état εt - Lη,t la loi de probabilité du bruit d’observation ηt. Le filtre optimal est la densité de l’état xt sachant yt : p(xt|yt ). Cette densité conditionnelle est définie par p(xt|yt ) = pXY (xt, yt )/pY (yt ). Pour construire nos filtres, nous utilisons des estimations par noyaux de convolution des densités pXY (xt, yt ) et pY (yt ). Définition 1: Un noyau est une application positive bornée K : IRd → IR telle que R K = 1 Définition 2: Un noyau de Parzen-Rosenblatt est un noyau vérifiant : limkxk→∞ kxkd K(x) = 0 Ainsi toute densité de probabilité est un noyau et les densités de la loi normale, de la loi exponentielle, . . . sont des noyaux de Parzen-Rosenblatt. La recherche autour de la question du choix du h et du noyau K est très active. Pour un choix pratique voir Bosq([2]), nous utilisons hn = std(x1, . . . , xn)n−0.2 dans la suite. Pour alléger les expressions la notation Kh(.) = 1/h K(./h) est employée dans la suite. C.1 Filtre par convolution simple Les estimateurs à noyaux de densité de probabilité nécessitent beaucoup d’observations pour être de bonne qualité (Bosq [2]). En général, en filtrage on n’en possède pas. Mais le système (2) permet d’en générer par simula- tion. Soient zt = (xt, yt ), et pour tout t soient µt et νt les me- sures de probabilité telles que zt ∼ µt et yt ∼ νt. A l’aide d’un algorithme simple, on peut simuler n réalisations de zt : z̃i t = (x̃i t, ỹt i) qui sont des représentants de µt. Ces réalisations z̃1 t , . . . , z̃n t , sont appelées particules. Nous construisons alors les estimations empiriques de µt et νt à l’aide de ces particules. Pour obtenir une estimation de p(xt|yt ), il suffit de les convoluer avec des noyaux K1 , K2 ce qui donne : pn (xt|yt ) = Pn i=1 K1 h(zt − z̃i t) Pn i=1 K2 h(yt − ỹt i) Les noyaux K1 et K2 sont de même nature, seule la di- mension de leurs espaces d’application est différente. On peut montrer la convergence de cet estimateur vers le filtre optimal, en utilisant des résultats d’estimation fonc- tionnelle (Bosq [2]). Théorème 1 (convergence en moyenne quadratique) Si les noyaux K1 et K2 sont de Parzen-Rosenblatt, si pY est po- sitive et continue au point yt et si p(xt|yt ) est bornée alors lim n→∞ hn = 0 lim n→∞ nhtd+s n = ∞ ) =⇒ lim n→∞ E[pn (xt|yt ) − p(xt|yt )]2 = 0 Théorème 2 (convergence L1 intégrée) lim n→∞ hn = 0 lim n→∞ nhtd+s n = ∞ ) =⇒ lim n→∞ E h Z |pn (xt|yt ) − p(xt|yt )|dxt i → 0 Remarque : En suivant la même démarche on peut construire un estimateur convergent de E[xt|yt ], b xt = Pn i=1 K2 h(yt −ỹt i )x̃i t Pn i=1 K2 h (yt−ỹt i ) . Nous l’utilisons pour les applications aux bioprocédés. Cependant, les conditions limn→∞ nhtd+s n = ∞ et limn→∞ hn = 0 ne sont pas satisfaisantes. En effet, elles impliquent que pour obtenir une estimation de qualité, plus la dimension des observations est grande, plus n doit être grand. Or, la dimension des observations, tq, augmente avec le temps. Le nombre n de particules z̃i t à générer doit donc augmenter avec t pour garder une qualité d’estimation stable. Grossièrement, on peut dire que l’augmentation est à peu près géométrique de raison h−d n . Le nombre n devient vite très grand, ce qui pose problème en pratique. Pour contourner ce problème, nous avons développé plu- sieurs variantes (Rossi & Vila [12]) ayant chacune leur intérêt. Nous nous limiterons ici au filtre par convolution avec ré-échantillonnage, détaillé dans la section suivante. Ce filtre est facile à mettre en oeuvre et conserve les pro- priétés de convergence du filtre à convolution simple tout en résolvant le problème de la croissance de n avec le temps. C.2 Filtre par convolution avec ré-échantillonnage Le filtre avec ré-échantillonnage à une structure sem- blable à celle du filtre à convolution simple, à laquelle on ajoute simplement une étape de sélection. Cette méthode de sélection, est inspirée de celles des filtres particulaires avec interactions développées par Pierre Del Moral ([3]). Elle repose à chaque instant t, sur l’utilisation de l’estima- tion de la densité conditionnelle de l’état, obtenue à l’étape précédente. Algorithme : pn 0 = π0, t ≥ 0 Etape 1 : Génération des états x̃1 t , . . . , x̃n t ∼ pn t (xt|yt ) Etape 2 : Génération des n particules Pour tout i = 1, · · · , n on obtient z̃i t+1 = (x̃i t+1, ỹi t+1) en appliquant le système (2) à x̃i t. Etape 3 : Estimation du filtre optimal : pn t+1(xt+1|yt+1 ) = Pn i=1 Khn (zt+1 − z̃i t+1) Pn i=1 Khn (yt+1 − ỹi t+1) t = t + 1, retour en 1. Remarque : dans ce filtre, le conditionnement par yt , non explicite dans la construction de l’estimateur de la den- sité, est pris en compte au travers de la loi pn t qui sert à l’étape 1, à générer les particules. Des variantes sont envisageables, notamment en ce qui concerne le ré-échantillonnage à l’étape 1. Plus précisément, il n’est pas toujours utile de rééchantillonner à chaque instant. Pour le décider on peut utiliser l’approche de Liu([7],[8]) en filtrage particulaire, basée sur la variance des poids associés aux particules. Son adaptation à notre algorithme est immédiate. Ce filtre avec ré-échantillonnage possède aussi de bonnes propriétés théoriques de convergence vers le filtre optimal, que nous ne pouvons pas présenter ici. Le principal avan- tage, par rapport au filtre par convolution simple, est que le nombre de particules à générer, n, pour construire un filtre de bonne qualité, augmente beaucoup moins vite avec le temps t. C.3 Traitement des modèles contenant des paramètres in- connus Les filtres à convolution présentés ci-dessus s’appliquent également aux systèmes de la forme suivante :  xt = ft(xt−1, θf , εt) yt = ht(xt, θh, ηt) (3) Où θ = (θf , θh) ∈ IRk est un vecteur de paramètres incon- nus. Le cadre de cette présentation étant limité, précisons sim- plement ici que les résultats théoriques garantissant la convergence du filtre vers le filtre optimal sont conservés. De plus, les estimateurs des paramètres θ construits en cours de filtrage convergent aussi vers les vraies valeurs de ces paramètres. Ces paramètres inconnus sont traités comme des états du système : ils sont affectés d’une densité de probabilité conditionnelle mise à jour à chaque instant t. La dimension du problème étant augmentée d’autant qu’il y a de paramètres inconnus, pour avoir une estimation satis- faisante, il faut donc augmenter le nombre, n, de particules générées, par rapport à un modèle sans paramètre inconnu. C.4 Comparaison avec d’autres filtres Nous comparons d’abord sur deux exemples classiques les performances de nos deux filtres, le filtre à convolution simple (CF), le filtre à convolution avec ré-échantillonnage (R-CF), avec le filtre de Kalman étendu (EKF), une de ses versions robustifiées (IEKF), le RBN, réseau de neurones à bases radiales de Yee([14]) et le NFFN, réseau de neurones récurrent de Lo([9]). Nous utilisons la même mesure de qualité que Lo et Yee pour comparer les filtres : la MSE (erreur quadratique moyenne) calculée sur N = 500 trajectoires de taille 120 : MSE(t) = 1 N N X i=1 k(xt,i − b xt,ik2 t = 1, · · · , 120. Considérons les deux systèmes dynamiques suivant : S1 =  xt+1 = 1.1 exp(−2x2 t ) − 1 + εt 2 yt = x3 t + 0.1 ∗ ηt et S2 =    xt+1 = A ∗ xt + εt 5 yt = [1 1]xt + 0.1ηt avec εt, ηt des bruits gaussiens centrés réduits indépendants, x0 ∼ N(−0.5, 0.12 ) pour S1, x0 ∼ N(0, 0.12 I2) pour S2 et A =  0.2 0.2 0.5 −0.5  . Le système S1 est aussi traité par Lo([9]) et Yee([14]). Le système S2 étant linéaire le filtre de Kalman est optimal, il sert donc de référence. Les moyennes des 120 MSE pour les différents filtres sont rassemblées dans les tableaux ci-dessous : système S1 MSE CF 0.0473 R-CF 0.0467 EKF 1.9335 IEKF (Lo) 0.07870 RBN (Yee) 0.0511 NFFN (Lo) 0.0449 système S2 MSE CF 0.0555 R-CF 0.0553 Kalman 0.0539 Nos filtres ont globalement un bon comportement, sur- tout par rapport à l’EKF pour le système S1. De plus, il est important de noter que Lo à utilisé 200000 données pour l’apprentissage de son réseau NFFN, le temps de mise en oeuvre n’est donc pas comparable. Comme on pouvait s’y attendre, le filtre par convolu- tion avec ré-échantillonnage réalise de meilleures perfor- mances que le filtre par convolution simple dans les deux applications précédentes. C’est généralement le cas pour d’autres systèmes. De plus, comme nous l’avons évoqué précédemment, il est possible de rajouter l’estimation de paramètres inconnus du modèle sans remettre en cause les résultats théoriques de convergence. Nous avons donc choisi d’utiliser le filtre avec ré-échantillonnage, pour esti- mer l’état dans le modèle de digestion anaérobie. D. Filtrage du procédé anaérobie Le modèle de ce procédé peut s’écrire sous la forme générale (2). Soit Xt = (B1, B2, Z, S1, S2, CT I) et ft le système dynamique discrétisé modélisant le bioréacteur. On a Xt+1 = ft(Xt). Les filtres par convolution supposent que le système dy- namique est bruité. Or comme le modèle considéré n’est pas exact, il est raisonnable de le bruiter artificiellement pour se rapprocher de la situation réelle. Le modèle que l’on considère dans la suite est donc de la forme Xt+1 = ft(Xt) + εt+1. Comme le modèle, bien que non exact, est de bonne qua- lité nous avons pris des petits bruits gaussiens : ε1 t , ε2 t ∼ N(0, 0.01), ε3 t ∼ N(0, 0.5), ε4 t ∼ N(0, 0.1), ε5 t ∼ N(0, 0.3) et ε6 t ∼ N(0, 0.5). Afin d’évaluer le potentiel du filtre par convolution avec ré-échantillonnage sur ce modèle, nous avons considéré différents cas de figures : nous avons fait varier pour chaque cas, l’ensemble des variables d’états observées et celui des variables à estimer. Cependant, comme les concentrations en substrats S1 et S2 sont toujours à estimer en pratique, nous les avons toujours supposées non observées. De plus, le pH et le débit de gaz du bioréacteur Qgaz étant me- surés, avec une assez grande fiabilité, nous les maintenons toujours dans l’ensemble des variables observées. Pour évaluer les performances de filtrage, nous présentons le tableau des moyennes des erreurs quadra- tiques (MSE) entre les valeurs vraies et filtrées des va- riables à estimer, sur N = 50 simulations d’une journée, avec des mesures toutes les deux minutes (t = 1, . . . , 720). Nous donnons aussi la représentation graphique d’une des 50 simulations, à savoir, les courbes (-) de valeurs vraies de chacune des variables, juxtaposées aux courbes (- -) des valeurs estimées par le filtre. Cas 1 Variables Observées : Y = [ pH, Qgaz] + η où η1, η2 ∼ N(0, 0.25). Variables Estimées : B1, B2, S1, S2, Z et CT I. Variable MSE B1 0.0495 B2 0.0369 Z 0.6936 S1 1.7188 S2 5.9692 CT I 0.7656 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 B1 0 0.2 0.4 0.6 0.8 1 0 0.5 1 1.5 B2 0 0.2 0.4 0.6 0.8 1 70 80 90 100 110 Z 0 0.2 0.4 0.6 0.8 1 0 2 4 6 8 S1 0 0.2 0.4 0.6 0.8 1 0 20 40 60 80 S2 0 0.2 0.4 0.6 0.8 1 20 40 60 80 100 Cti temps temps Fig. 1. Illustration du Cas 1, n = 500 particules Cas 2 Variables Observées : Y = [ pH, Qgaz, Z, CT I ]+ η où η1, η2, η3 et η4 ∼ N(0, 0.25). Variables Estimées : B1, B2, S1 et S2. Variable MSE B1 0.0493 B2 0.0361 S1 1.7091 S2 5.9420 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.5 1 1.5 B1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.5 1 1.5 B2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 5 10 S1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 50 100 S2 temps Fig. 2. Illustration du Cas 2, n = 5000 particules Il ressort des deux premiers cas, que la qualité du filtrage est très peu affectée par la suppression des observations Z et CT I. De plus, le fait d’estimer un états à six dimensions pour le cas 1 ou un état à quatre dimensions pour le cas 2, n’affecte pas le filtre. On retrouve ainsi la robustesse, par rapport aux dimensions, caractéristique des méthodes de Monte Carlo. Afin de tester notre filtre en situation de forte erreur de modèle, dans les deux cas suivants, nous simplifions le modèle postulé pour le procédé, en supposant que les bio- masses restent constantes (approximations fréquentes en pratique). B1 = 1 et B2 = 1.25 Le système postulé devient ainsi observable. Cependant, les évolutions vraies (simulées) de B1 et B2 restent comme dans le modèle (1). Cas 3 Variables Observées : Y = [ pH, Qgaz] + η où η1, η2 ∼ N(0, 0.25). Variables Estimées : S1, S2, Z et CT I. Variable MSE Z 49.5482 S1 2.9866 S2 142.5208 CT I 117.1285 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 70 80 90 100 Z 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 5 10 S1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 20 40 60 S2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 50 100 Cti temps Fig. 3. Illustration du Cas 3, n = 500 particules Cas 4 Variables Observées : Y = [ pH, Qgaz, Z, CT I ]+ η où η1, η2, η3 et η4 ∼ N(0, 0.25). Variables Estimées : S1 et S2. Variable MSE S1 2.2941 S2 25.7809 Cette fois, l’apport de Z et CT I est plus significatif, puisque les résultats sont nettement meilleurs dans le cas 4. On remarque aussi que les MSE de Z et de CT I sont beaucoup plus élevées que pour les cas 1 et 2. Plusieurs éléments peuvent expliquer cette différence. La raison prin- cipale est bien sûr que les biomasses sont, à tort, supposées constantes pour les cas 3 et 4. IV. Conclusion Les filtres par convolution de particules que nous avons développés présentent les mêmes performances que celles des filtres particulaires plus classiques, avec des conditions 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 1 2 3 4 5 6 7 S1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 10 20 30 40 50 60 S2 temps Fig. 4. Illustration du Cas 4, n = 500 particules de mises en oeuvre moins contraignants puisqu’ils n’exigent pas la connaissance de la fonction de vraisemblance des va- riables d’observation. Les résultats obtenus en simulation, par le filtre avec ré-échantillonnage, sur un modèle de digestion anaérobie laissent présager la possibilité d’une utilisation en situa- tion réelle. De plus, la prise en compte et l’estimation de paramètres inconnus dans le modèle ne soulève aucun problème théorique ou pratique. Cette propriété revêt une impor- tance particulière dans le cas des modèles de bioprocédés. Références [1] O. Bernard, Z. Hadj-Sadok, D. Dochain, A. Genovesi, J-P Steyer, « Dynamical Model Development and Parameter Identification for an Anaerobic Wastewater Treatment Process ». Biotechnology and Bioengineering vol. 75, no. 4, 2001. [2] D. Bosq, J-P Lecoutre, Théorie de l’estimation fonctionnelle. Economica, Paris, 1987. [3] P. Del Moral, J. Jacod, P. Protter, « The Monte-Carlo method for filtering with discrete-time observations ». Probab Theory Relat. Fields 120, 346-368, 2001. [4] S. Haykin, P. Yee, E. Derbez, « Optimum Nonlinear Filtering » . IEEE Trans. signal process, vol.45, No11, 1997. [5] A.H. Jazwinski, Stochastic processes and filtering theory. Acade- mic Press, London, 1970. [6] R.E. Kalman, « A new approach to linear filtering and predic- tion theory ». Trans. of the ASME, Jour. of Basic Eng.,82,34-45, 1960. [7] A. Kong, J.S. Liu, W.H. Wong, « Sequential Imputations and Bayesian Missing Data Problems ». Journal of the American Sta- tistical Association, 89(425), p278-288, 1994. [8] J.S. Liu, « Metropolized Independent Sampling with Compa- raisons to Rejection Sampling and Importance Sampling ». Stat. Comp., vol. 6, p113-119, 1996. [9] J.T. Lo, « Synthetic Approach to Optimal Filtering ». IEEE Trans. neur. net., vol.5, No5, 1994. [10] N. Oudjane, « Stabilité et approximations particulaires en fil- trage non linéaires, application au pistage ». PhD thesis, Univer- sité de Rennes I, 2000. [11] H.L. Smith, P. Waltman, The theory of the chemostat : Dy- namics of mocrobial competition., Cambridge University Press, Cambridge, 1995. [12] V. Rossi, J-P Vila, « Filtrage non linéaire en temps discret par convolution de particules ». Actes des XXXVèmes Journées de Statistiques, p823-826, 2003. [13] J-P Steyer, J-C Bouvier, T. Conte, P. Gras, P. Sousbie, « Eva- luation of four year experience with a fully instrumented anaero- bic digestion process ». Water Science and Technology, vol. 45, no. 4-5, p495-502, 2002. [14] P.V. Yee, S. Haykin, Regularised radial basis function networks, Theory and Application. Wiley, New York, 2001.