LogoLogo

Lapébie, François-Xavier. Développement et validation de scores de risque dans les maladies vasculaires

Lapébie, François-Xavier (2021). Développement et validation de scores de risque dans les maladies vasculaires.

[img]
Preview
PDF - nécessite un logiciel de visualisation PDF comme GSview, Xpdf or Adobe Acrobat Reader
3546Kb

Résumé en francais

Les modèles statistiques multivariés ont des applications variées en médecine. Ils peuvent être descriptifs, capturant l'association entre une variable dépendante et des variables indépendantes, explicatifs, testant une hypothèse causale entre une exposition et un évènement d'intérêt, ou prédictifs, calculant pour un individu la probabilité d'un diagnostic ou de la survenue d'un évènement. Ces modèles sont majoritairement dérivés d'études de cohortes. Pour leur développement, le choix du type de modèle, la sélection des variables pour le modèle final et l'évaluation de sa performance (validation interne et externe) ont une importance particulière. Les données manquantes causent un biais dans l'estimation des paramètres et les tests de significativité, et limitent le nombre de patients pour l'analyse multivariée ; des méthodes d'imputation existent. Dans ce travail, ces différentes étapes ont été appliquées à deux cohortes de maladies vasculaires. Des modèles de survie ont été utilisés : le modèle de Cox, et le modèle de Fine et Gray, qui prend en compte les risques compétitifs. La cohorte COPART (cohorte de patients artériopathes) est une cohorte nationale multicentrique prospective s'intéressant aux patients hospitalisés pour la prise en charge d'une artériopathie athéromateuse des membres inférieurs symptomatique. Deux modèles explicatifs ont été dérivés : un premier évaluant l'impact du diabète sur le risque de décès de cause cardiovasculaire, d'infarctus du myocarde et d'accident vasculaire cérébral ischémique, et un second évaluant l'impact des antagonistes des récepteurs de l'angiotensine de type 2 sur le risque de décès. Un troisième modèle, descriptif, a été constitué, pour identifier les facteurs associés au risque d'amputation majeure du membre inférieur. La sélection des variables pour les modèles explicatifs a été réalisée sur les données de la littérature, indépendamment des données de la cohorte, avec une représentation des liens de causalité entre variables par un graphe acyclique dirigé, guidant ensuite la sélection. Les variables du modèle descriptif ont été sélectionnées sur les données de la cohorte, à l'aide d'un algorithme de sélection descendante. Enfin, la validité externe, notamment la transposabilité, de deux études contrôlées randomisées a été évaluée dans COPART. La cohorte RIETE (registro informatizado de la enfermedad thromboembolica venosa) est une cohorte internationale multicentrique prospective incluant les patients présentant une embolie pulmonaire ou une thrombose veineuse profonde. Le sous-groupe des patients présentant un évènement thromboembolique veineux associé à un cancer a fait l'objet de ce travail. Une imputation multiple des données manquantes par équations chaînées a été réalisée. Les facteurs associés à la récidive à l'arrêt d'un traitement anticoagulant d'une durée d'au moins 3 mois ont ensuite été identifiés, à l'aide d'une méthode mixte : dans la 1ère étape, les variables connues dans la littérature pour leur association au risque de récidive ont été sélectionnées indépendamment des résultats dans la cohorte, puis dans la 2ème étape, une sélection descendante a été appliquée à partir du modèle plein, en forçant dans le modèle descriptif final les variables sélectionnées dans la 1ère étape. A partir de ces résultats, un modèle prédictif du risque de récidive d'évènement thromboembolique veineux a été sélectionné. La performance du modèle a été évaluée dans les données initiales avec imputation des valeurs manquantes, puis une validation interne a été réalisée par rééchantillonnage par bootstrap ; l'optimisme des différents paramètres de la validation interne (pente de la droite de calibration, statistique D de Royston et Sauerbrei pour la discrimination, R_D^2 de Royston et Sauerbrei pour la part de variance de la variable dépendante expliquée par le modèle) a ainsi été évalué, puis retranché à la performance apparente, tout en tenant compte de la présence de données imputées.

Sous la direction du :
Directeur de thèse
Bongard, Vanina
Ecole doctorale:Mathématiques, informatique, télécommunications de Toulouse (MITT)
laboratoire/Unité de recherche :Centre d'Epidémiologie et de Recherche en santé des POPulations (CERPOP), UMR 1295
Mots-clés libres :Modèles statistiques multivariés - Score de risque - Imputation multiple par équations chaînées - Analyse de survie - Artériopathie athéromateuse des membres inférieurs - Maladie thromboembolique veineuse
Sujets :Sciences du vivant
Déposé le :25 Mar 2022 17:16