Modélisation de bioprocédés par une approche linéaire hybride et ensembliste

05/09/2017
Publication e-STA e-STA 2008-2
OAI : oai:www.see.asso.fr:545:2008-2:19830
DOI : You do not have permission to access embedded form.

Résumé

Modélisation de bioprocédés par une approche linéaire hybride et ensembliste

Métriques

23
12
126.61 Ko
 application/pdf
bitcache://f68a527018fed5828a0b7c9728a1923c3280d9d5

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/545:2008-2/19830</identifier><creators><creator><creatorName>O. Adrot</creatorName></creator><creator><creatorName>Jean-Marie Flaus</creatorName></creator></creators><titles>
            <title>Modélisation de bioprocédés par une approche linéaire hybride et ensembliste</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2017</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Tue 5 Sep 2017</date>
	    <date dateType="Updated">Tue 5 Sep 2017</date>
            <date dateType="Submitted">Sat 17 Feb 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">f68a527018fed5828a0b7c9728a1923c3280d9d5</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>33650</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

Résumé — L’objectif est de remplacer les relations mathématiques complexes utilisées pour décrire la cinétique d’un bioprocédé par une famille de modèles linéaires commutés. L’approche ensembliste est utilisée pour prendre en compte les incertitudes de modèle et l’imprécision sur les conditions expérimentales afin de générer une enveloppe estimant la trajectoire réelle du bioprocédé. Mots clés — Analyse par intervalle, bioprocédé, estimation, incertitude de modèle. I. INTRODUCTION L’industrie biotechnologique est un secteur important en raison de son potentiel économique, social et environnemental. Son développement est lié à une demande croissante pour les produits biologiques conçus dans l’agroalimentaire, la pharmacologie, la chimie, avec des applications plus récentes dans l’environnement durable, comme par exemple le traitement d’effluents. Ce développement demande un pilotage et une surveillance du système biologique, ce qui nécessite la conception de modèles mathématiques en décrivant le comportement. Ces modèles permettent aussi de reconstruire certaines variables physiques qui ne peuvent être mesurées pour des questions de faisabilité technique et de coût [5], ou de concevoir des simulateurs numériques d’essais pour différentes conditions expérimentales. De manière classique, la modélisation d’un bioprocédé nécessite de représenter le comportement complexe du vivant et fait appel à un certain nombre de lois d’évolution des espèces généralement non-linéaires [12] plus ou moins complexes en fonction du niveau de précision donné, mais de toute façon approchées. De ce fait, on aboutit à un modèle de structure complexe avec une certaine imprécision dans la modélisation et des difficultés lors de l’identification des paramètres. L’objectif de ce travail est de montrer qu’il est possible de remplacer un modèle à structure non-linéaire habituellement utilisé pour représenter un bioprocédé par une famille de modèles linéaires commutés. Nous proposons par ailleurs d’utiliser une approche ensembliste pour représenter le modèle O. Adrot et J.-M. Flaus sont membres du Laboratoire des Sciences pour la Conception, l’Optimisation et la Production (G-SCOP), INPG, UJF, CNRS, 46 avenue Félix Viallet, 38031 Grenoble Cedex, (Olivier.Adrot@g- scop.inpg.fr, Jean-Marie.Flaus@g-scop.inpg.fr). du taux de croissance [11], ce qui permet de décrire explicitement les incertitudes générées par l’approximation. Dans la section 2, nous présentons le modèle générique du bioprocédé étudié. Dans la section 3, nous montrons que l’approximation de la cinétique par une fonction constante par morceaux permet de réaliser une modélisation satisfaisante du bioprocédé, en illustrant ceci sur un procédé modélisé par une loi de Monod comme référence. Dans la section 4, nous présenterons les principes élémentaires des méthodes ensemblistes en mettant en évidence leur intérêt pour la prise en compte des incertitudes de modèle. Enfin, dans la section 5, nous proposons un modèle ensembliste hybride permettant de décrire complètement l’incertitude sur le taux de croissance et de générer les enveloppes de trajectoires des concentrations, appelées tubes de trajectoires, en fonction de cette incertitude. II. MODELE GENERIQUE DE BIOPROCEDE Un bioprocédé évoluant dans un réacteur supposé parfaitement agité peut être modélisé en écrivant les équations de bilan pour chaque constituant, ce qui donne un modèle de la forme générale suivante [3] : ( ) ( )in d D ( ) dt = + − + z K r z z z q z (1) où z est le vecteur d’état composé des concentrations des constituants, K est la matrice des rendements, r est un vecteur composé des taux de réaction et décrivant la cinétique, D est le taux de dilution (souvent variable d’action) et q décrit les échanges gazeux. Un bioprocédé peut opérer en mode batch sans ajout ni soutirage (D = 0), en mode fed-batch avec ajout de substrat sans soutirage ou bien en mode continu avec un ajout égal au soutirage. Dans la suite, nous considérons un bioprocédé opérant en mode batch, dans lequel le substrat, dont la concentration est notée S, est transformé par la biomasse de concentration X. Le rendement de la transformation est noté Yxs et la cinétique est décrite par le taux de croissance µ, dépendant de S. Le modèle peut alors s’écrire : ( ) ( )( ) ( ) ( ) ( )( ) ( ) 1  =   = −  xs dX t S t X t dt dS t S t X t dt Y µ µ (2) Modélisation de bioprocédés par une approche linéaire hybride et ensembliste J.-M. Flaus, O. Adrot e-STA copyright © 2008 by see Volume 5 (2008), N°2 pp 35-39 Une difficulté rencontrée lors de la construction de ce modèle à partir de données expérimentales est d’établir la loi cinétique permettant d’exprimer le taux de croissance en fonction de la concentration en substrat. Un certain nombre d’expressions ont été proposées dans la littérature dont la plus connue est la loi de Monod [6] : ( )( ) ( ) ( ) = + max S t S t K S t µ µ (3) où µmax et K sont deux paramètres, définissant respectivement le taux de croissance maximal et la constante de demi saturation. D’autres lois existent comme par exemple la loi de Haldane [1] ou un produit de deux relations de Michaelis-Menten. Choisir une loi, à partir de données expérimentales, souvent très bruitées, est une réelle difficulté et l’expérience montre que la structure de la relation choisie ne s’impose pas toujours de façon nette. Par conséquent, dans un objectif d’estimation, de commande ou de surveillance, il est intéressant de choisir la structure la plus simple possible permettant de représenter correctement les données. Dans ce travail, nous avons poursuivi cette logique jusqu’à choisir une fonction constante par morceaux pour le taux de croissance et étudié les performances de cette approche. L’intérêt est d’avoir un modèle linéaire commuté pour la description de la dynamique du bioprocédé. III. APPROCHE LINEAIRE HYBRIDE L’objectif de cette partie est de montrer qu’il est possible de modéliser un bioprocédé tel que décrit plus haut par une famille de modèles linéaires, le modèle spécifique décrivant le procédé à un instant donné dépendant du domaine de l’espace d’état dans lequel se trouve le vecteur d’état. Un tel modèle est un modèle hybride discret à temps continu ou discret, puisque le système est décrit d’une part par la valeur du vecteur d’état en fonction du temps (continu ou échantillonné) et d’autre part par le mode discret dans lequel il se trouve [4]. Le modèle dans un mode donné noté mi étant linéaire, l’intérêt de cette approche est de permettre une modélisation plus facile, et une exploitation simplifiée du modèle pour l’estimation, la commande ou la surveillance. La forme générale du modèle utilisé, obtenu à partir de (2) par discrétisation, est la suivante : ( )1 1 1+ +  = +   = −   k k e k e k k k k xs X X T T S S X Y µ µ (4) où Te désigne la période d’échantillonnage et l’indice k le temps discret. Nous proposons de modéliser le taux de croissance par une fonction constante par morceaux du substrat. Le domaine de variation de S est partitionné en n domaines de validité notés Di : [ [ [ [ [ [1 1 2 1 1 1 1 0, + = 0, , , ,+ > , , + − + + ∞ ∞       =    ∪ ∪⋯∪ ∪⋯∪i i n i i i i i S S S S S S S S D S S Sur chaque domaine de validité Di , la valeur du taux de croissance µk est fixée à une valeur constante prédéfinie comme suit (figure 1) : i i k kS D∈ ⇒ =µ µ Dans le cadre de notre étude, les valeurs nominales µi de chaque mode mi sont déterminées à partir de la relation de Monod, de façon à pouvoir comparer cette approche au modèle non-linéaire classique. Cependant, ces valeurs peuvent aussi être déterminées à partir de données expérimentales, en déterminant la courbe µ(S) à partir des mesures de X et S. On construit ainsi pour chaque mode mi , un modèle d’état linéaire spécifique Mi (5). Le modèle Mi valide est déterminé en testant l’appartenance de la valeur courante Sk aux différents domaines de validité Di , i∈{1,…,n}. ( )1 1 1 si + +  = +  ∈ = −  i k k e i kie k k k xs X X T S DT S S X Y µ µ (5) Sur la figure 1, un partitionnement, effectué lorsque 4 modes ont été choisis, est représenté, sachant que la valeur nominale µi déterminée a été ici fixée arbitrairement à la valeur moyenne de µk sur chaque mode. Un 5ème mode (m0 ) correspondant à un taux de croissance nul a été ajouté pour représenter correctement le procédé en régime stationnaire lorsque qu’il n’y a plus de substrat en présence et que la concentration en biomasse n’évolue plus. La figure 2 montre les trajectoires simulées à l’aide du modèle linéaire commuté et le modèle non linéaire. Malgré le faible nombre de modes utilisés, et de façon assez inattendue, les trajectoires sont pratiquement identiques. Ceci montre que l’utilisation d’une structure complexe pour la cinétique ne s’impose pas pour obtenir une bonne modélisation du système. 0 1 2 3 4 5 6 7 8 0 0.05 0.1 0 10 20 30 40 50 60 0 1 2 3 4 Fig. 1. Partitionnement de µ(S) µ(S) Modes m1 m2 m3 m4 µi S k Mode valide m m m m m e-STA copyright © 2008 by see Volume 5 (2008), N°2 pp 35-39 Fig. 2. Simulation de X et S IV. METHODES ENSEMBLISTES De manière générale, les méthodes ensemblistes désignent toutes les approches permettant de manipuler des sous- ensembles de Rn , et de résoudre des contraintes liant les éléments de ces ensembles (ces contraintes pouvant être des relations arithmétiques). Les sous-ensembles élémentaires utilisés peuvent prendre des formes diverses et variées comme des zonotopes, des polytopes, des ellipsoïdes, des pavés (ou boîtes). Les points forts de ces méthodes résident dans leur capacité à calculer en une seule fois toutes les images par une fonction d’un ensemble de valeurs données et à prendre en compte l’imprécision sur la valeur des nombres (que ce soit les erreurs d’arrondis liées aux calculs ou les incertitudes sur la valeur de paramètres ou de grandeurs observées). L’approche utilisée ici s’appuie sur une représentation des ensembles par des intervalles ou plus généralement des unions d’intervalles, encore appelées boîtes et liste de boîtes dans la littérature. Cette méthode permet naturellement de représenter l’imprécision d’un modèle. En effet, au lieu de modéliser un paramètre ou une mesure connue avec imprécision par une valeur réelle nominale, l’idée consiste à décrire cette grandeur par son support, en l’occurrence un intervalle, c’est-à-dire l’ensemble des valeurs qu’elle est susceptible de prendre. Par définition, un intervalle est un ensemble fermé et borné de nombres réels [8], [9]. Si x désigne une variable réelle bornée, alors l’intervalle [x] auquel elle appartient est défini par: [ ] { }= ∈ ≤ ≤x x R / x x x , où x et x sont des nombres réels représentant respectivement les bornes inférieure et supérieure de x. De manière générale, l’intervalle [x] sera noté comme suit : [ ] [ ]=x x,x . D’un point de vue modélisation, le fait de considérer la variable bornée x comme incertaine signifie que seul son support [x] est connu (la valeur courante de x étant elle inaccessible). Le principe de base du calcul par intervalle est l’évaluation de l’image d’un intervalle [x] par une fonction f. Le résultat de cette évaluation [f]([x]) est un intervalle englobant l’ensemble image ( ) [ ]{ }∀ ∈f x / x x de f. C’est cette propriété d’inclusion de l’ensemble image dans [f]([x]) qui permet de garantir en fonction du problème traité que toutes les solutions seront bien trouvées. Cependant, le résultat est un sur ensemble de la solution exacte et on parle alors de « pessimisme » [8], [9]. Cette surestimation de l’ensemble image recherché devient crucial dans le cadre d’un modèle récursif où le résultat obtenu à un instant donné est réutilisé lors de la prochaine itération, car répéter sans précaution cette opération risque d’introduire à chaque itération un peu plus de pessimisme pour conduire à terme à l’explosion de la taille des ensembles calculés, phénomène appelé effet d’enveloppement ou wrapping effect [2], [7]. Afin de l’éviter et d’améliorer la précision des résultats, différentes techniques existent [10]. Nous utiliserons ici la structure particulière du système, qui impose des contraintes sur les bilans de masse globaux et propagerons ces contraintes parallèlement aux évaluations par intervalle des relations du modèle. V. MODELE COMMUTE ENSEMBLISTE Comme nous avons pu le voir dans la partie 3, il est possible de représenter de façon satisfaisante le taux de croissance par une fonction constante par morceaux de façon à obtenir un modèle linéaire commuté. Une question importante est de savoir quelle est la précision qu’il est possible d’obtenir avec un tel modèle. Pour y répondre, nous nous proposons dans cette partie de développer un modèle ensembliste du procédé, c'est-à-dire de représenter le taux de croissance par un intervalle et de proposer une méthode pour calculer l’enveloppe de toutes les trajectoires possibles compte tenu de l’incertitude sur µ. Avec un tel outil, il sera possible de moduler le découpage du domaine du substrat de façon à avoir une représentation suffisamment précise de la cinétique et à générer une enveloppe de largeur suffisamment petite. Un tel modèle, représentant le taux de croissance par un intervalle permet d’appréhender tous les comportements possibles du bioprocédé, au lieu de décrire un comportement moyen comme dans la section 3. Le principe consiste à prendre en compte l’incertitude sur le paramètre µk pour chaque mode, information déterminante pour caractériser la qualité du modèle obtenu. A partir du modèle commuté (5), l’idée est de représenter le paramètre µk pour chaque modèle Mi non pas par une valeur constante nominale µi , mais par une variable bornée, c’est-à- dire une variable dont la valeur courante est inconnue, mais dont le support intervalle [µ]i est invariant et connu : µk ∈ [µ]i et qui contient toutes les valeurs possibles de µk pour ce mode (figure 3). Remarquons que les domaines de validité Di sont 0 1 2 3 4 5 6 0 0. 0. 0. 0. 0. 0 1 2 3 4 5 6 0 2 4 6 Modèle non-linéaire Modèle linéaire commuté S X k k e-STA copyright © 2008 by see Volume 5 (2008), N°2 pp 35-39 eux aussi des intervalles [S]i et que différents types de partitionnement peuvent être envisagés. Le partitionnement régulier (figure 3) conduit à des intervalles [µ]i de même taille tandis que celui suivant une loi exponentielle (figure 4) permet de gagner en précision pour les modes proches du régime stationnaire (taux de croissance faible). 0 1 2 3 4 5 6 7 8 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Fig. 3. Partitionnement régulier 0 1 2 3 4 5 6 7 8 9 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 Fig. 4. Partitionnement exponentiel En remplaçant µk par son support, un modèle commuté Mc ensembliste est constitué d’une famille de n modèles d’état ensemblistes Mi définis par : [ ] [ ] [ ]( ) [ ] [ ] [ ] [ ] 1 1 1+ +  = +  = −  i ek k ie k k k xs X X T T S S X Y µ µ (6) où [X]k et [S]k sont des intervalles dépendant du temps conduisant lors de l’évaluation de ce modèle en simulation, respectivement à deux tubes de trajectoires en X et S. Dans le cas où Yxs est mal connu, on pourrait aussi envisager de modéliser celui-ci par un intervalle [Yxs] puisque ce paramètre est a priori constant. Algorithme de simulation De façon à simuler le comportement du système, nous utilisons tous les modèles Mi (6) valides, c’est-à-dire pour lesquels la valeur courante de l’intervalle [S]k (domaine possible du substrat à l’instant k), et le domaine de validité Di associé (partition réalisée pour décrire le taux de croissance) ont une intersection non nulle. Notons qu’à un instant donné, plusieurs modèles peuvent être valides. L’intervalle [S]k est alors divisé en autant d’intervalles que de modèles valides. Pour chacun d’eux, l’évolution de l’état est calculée par le modèle dans le mode correspondant. Le résultat de l’évolution est ensuite réduit en utilisant la contrainte de conservation de la masse obtenue par (1) en éliminant les éléments dépendant du temps. Plus de détails sont donnés dans [3]. Dans notre cas, cette contrainte s’écrit : [ ]( ) [ ]( )0 00∈ − + −xsk k X X Y S S . Toutes les solutions ne vérifiant pas cette contrainte après le pas d’intégration sont éliminées. De façon à améliorer la précision, le domaine [X,S] est sub-divisé en domaines plus petits lors de cette opération, [X,S] est donc représenté par une union de boîtes. Résultats Pour tester notre approche, nous avons tout d’abord construit un modèle par intervalle pour le taux de croissance à partir de la loi de Monod, en prenant le maximum et le minimum des valeurs pour chaque domaine Di . Le découpage de l’espace de variation de S a été réalisé avec un échantillonnage régulier, ce qui conduit à des largeurs irrégulières pour [µ]i , comme on peut le voir sur la figure 5.a. Les valeurs numériques utilisées pour les simulations sont les suivantes : Yxs = 0.5, µmax = 0.2, K = 10, Te = 0.1, X0= 0.1 g/l, S0 = 10 g/l Le résultat de la simulation est présenté sur la figure 5.b. L’enveloppe est de largeur relativement faible. Celle-ci est due à l’incertitude sur le taux de croissance et non à l’effet d’enveloppement. Elle est donc inhérente à l’incertitude de représentation de µ. Si cette largeur d’enveloppe est trop importante pour l’utilisation envisagée, il est possible d’utiliser une modélisation plus fine pour le taux de croissance, soit en réalisant une partition irrégulière pour S, soit en découpant en intervalles plus étroits (figure 6.a). Dans ce cas, on obtient une meilleure précision de la valeur finale de l’état (largeur réduite de moitié). Ceci peut être important pour certaines applications, mais n’est pas nécessaire par exemple si un recalage est effectué en ligne via une estimation d’état [5]. m1 m2 m3 m4 S [µ]3 D3 m1 m2 m3 m4 S [µ]3 D3 µ(S) µ(S) e-STA copyright © 2008 by see Volume 5 (2008), N°2 pp 35-39 Fig. 5.a : Modélisation par intervalles de µ(S) - cas I Fig. 5.b : Résultats de simulation - cas I Figure 6.a : Modélisation par intervalles de µ(S) - cas II Figure 5.b : Résultats de simulation - cas II A partir des résultats, il est possible d’imaginer une nouvelle approche méthodologique pour la construction de modèles de bioprocédés. Tout d’abord, de façon classique, on trace, à partir des données expérimentales, les points (S,µ). A partir de ces points, on découpe S en domaines et on identifie la fonction par intervalles par morceaux donnant [µ]i . Ensuite, à partir de ce modèle, on simule l’évolution du procédé. Si les tubes sont suffisamment précis, on peut considérer que la modélisation est terminée, alors que dans le cas contraire, on poursuit les expérimentations en privilégiant les prélèvements dans la zone de substrat pour laquelle la largeur sur [µ]i est importante. L’intérêt de cette approche est de ne pas nécessiter d’hypothèses sur la forme de la loi cinétique et mettre clairement en évidence les effets d’une incertitude sur µ. VI. CONCLUSION Une approche de modélisation par modèle hybride linéaire permet d’obtenir des résultats satisfaisants pour la modélisation des bioprocédés. Elle permet d’utiliser un modèle à structure linéaire tout en modélisant les incertitudes sur les paramètres et les conditions expérimentales. Cette linéarité permet une exploitation plus facile du modèle, à la fois dans le cas d’un modèle classique ou d’un modèle ensembliste. En particulier la propagation de la valeur de l’état peut être réalisée de façon plus performante. La prochaine étape consistera en une application sur un procédé expérimental de cette approche dans un objectif de supervision et de pilotage. VII. REFERENCES [1] Andrews J., A mathematical model for the continuous culture of microorganisms utilizing inhibitory substrate, Biotechnol & Bioeng., 1968, vol 10, pp707-723. [2] Anguelov R. Markov S, Wrapping effect and wrapping, Reliable Computing, 1998, Volume 4, Number 4, pp. 311-330(20). [3] Bastin G., Dochain D., On-line estimation and adaptive control of bioreactors Amsterdam ; New York ; Oxford : Elsevier Publishing Company, 1990. [4] Flaus J-M, Modeling and Analysis of Hybrid Dynamical Systems: a beginner's guide, Journal Européen des Systèmes Automatisés, 1998, 32(7-8), p797-830. [5] Flaus J-M., Adrot O., Estimation d'état sûre pour procédés non linéaires par méthodes ensemblistes – Application à un procédé biotechnologique, Journal Européen des Systèmes Automatisés, 2003, Vol. 37 no 9, Edition Hermes Lavoisier. [6] Monod J., Recherches sur la croissance des cultures bactériennes, Paris, France Hermann, 1942. [7] Moore R.E., Interval Analysis, Prentice Hall, 1966. [8] Moore R.E., Methods and applications of interval analysis, SIAM, Philadelphia, Pennsylvania, 1979. [9] Neumaier A., Interval methods for systems of equations, Cambridge University Press, Cambridge, 1990. [10] Nedialkov S., Jackson K. R., Corliss G. F., Validated Solutions of Initial Value Problems for Ordinary Differential Equations, Applied Mathematics and Computation, 1999, 105, pp. 21-68. [11] Romero G. Flaus JM., Chéruy A., Semiqualitative modelling of bioprocesses, Mathematical and Computer Modelling of Dynamical Systems, 1997, Volume 3, Issue 3, pages 246 - 264 [12] Wang D. et al., Fermentation and enzyme technology, John Wiley and Sons, 1979. e-STA copyright © 2008 by see Volume 5 (2008), N°2 pp 35-39