Deep Reinforcement Learning for Controlled Piecewise Deterministic Markov Process in Cancer Treatment Follow-up - Institut de Mathématiques et de Modélisation de Montpellier
Communication Dans Un Congrès Année : 2024

Deep Reinforcement Learning for Controlled Piecewise Deterministic Markov Process in Cancer Treatment Follow-up

Résumé

Myeloma requires long-term follow-up and is characterized by phases of remission and relapse, during which a marker is monitored and serves as the basis for a treatment policy. We model the dynamics of the marker by a controlled Piecewise Deterministic Markov Process with noisy observations, continuous state space and a partially known model and we propose a new control method for this PDMP. We suggest a transformation of this problem into a continuous state space Partially Observable Markov Decision Process, on which we implement a deep reinforcement learning algorithm. We show experimentally on simulated marker trajectories that this algorithm allows effective decision-making.
Le myélome nécessite un suivi à long terme et se caractérise par des phases de rémission et de rechute, pendant lesquelles un marqueur est surveillé et sert de base à une politique de traitement. Nous modélisons la dynamique du marqueur par un Processus Markovien Déterministe par Morceaux contrôlé à observations bruitées, espace d'état continu et à modèle partiellement connu et nous proposons une nouvelle méthode de contrôle pour ce PDMP. Nous transformons ce problème en Processus de Décision Markovien Partiellement Observé à espace d'état continu, sur lequel nous mettons en oeuvre un algorithme d'apprentissage par renforcement profond. Nous montrons expérimentalement sur des trajectoires de marqueur simulées que cet algorithme permet une prise de décision efficace.
Fichier principal
Vignette du fichier
deep_po_pdmp_papers-5.pdf (253.27 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04695790 , version 1 (12-09-2024)

Identifiants

  • HAL Id : hal-04695790 , version 1

Citer

Alice Cleynen, Benoîte de Saporta, Orlane Rossini, Régis Sabbadin, Meritxell Vinyals. Deep Reinforcement Learning for Controlled Piecewise Deterministic Markov Process in Cancer Treatment Follow-up. La journée Santé et IA, Plate-Forme Intelligence Artificielle (PFIA), Jul 2024, La Rochelle (Charente-Maritime, Nouvelle-Aquitaine), France. ⟨hal-04695790⟩
108 Consultations
17 Téléchargements

Partager

More