Analyse de survie par la méthode de Kaplan Meier

L’analyse de survie, est une méthode statistique qui permet d’estimer le temps écoulé jusqu’à la survenu d’un évènement. Typiquement l’analyse de survie est très utilisée en recherche médicale et épidémiologique pour étudier la survenu d’un décès (survie) chez des patients atteints d’une maladie grave. Mais les champs d’application de cette méthode sont très vastes. En effet, l’analyse de survie permet d’étudier la survenue de n’importe quel événement et le délai de sa réalisation. Cela peut être par exemple la survenu d’une grossesse après un traitement contre l’infertilité. Ou encore le retour à l’emploi après une formation. Malgré les différents champs d’application, nous garderons le terme de « survie » pour définir le délai écoulé entre un événement initial et un événement final.

Principe de l’analyse de survie

Le principe d’une analyse de survie est donc d’estimer la survenue de l’événement final en fonction du temps écoulé depuis l’événement initial. Par exemple pour évaluer un traitement contre une maladie grave, nous évaluerons le temps qui passe depuis l’administration de ce traitement jusqu’à la survenue d’un décès. Ceci revient à étudier la probabilité de survenue de l’événement final (décès), en analysant les différents intervalles de temps ou les patients sont vivants.

Il est cependant possible que lors d’une étude de cohorte bien conçue, de suivre un groupe de sujets exposés à des facteurs de risque spécifiques, et d’analyser la survie associée à cette cohorte. Ceci offre une perspective précieuse pour évaluer le temps jusqu’à l’occurrence d’un événement particulier, contribuant ainsi à une compréhension approfondie des dynamiques temporelles des résultats médicaux.

L’analyse de survie peut être descriptive, dans le cas où nous suivons l’évolution d’un seul groupe de sujets. Mais elle est aussi comparative, lorsque nous nous intéressons à comparer deux courbes de survies suite à deux traitements différents. Dans ce dernier cas nous utilisons le test du Log Rank pour l’analyse de survie.

Il est généralement possibe d’utiliser d’autres méthodes, telles que les réseaux de neurones, pour modéliser des données temporelles dans le cadre du pronostic médical.

Dans cet article, nous aborderons la particularité de l’analyse de survie et les différents termes utilisés.  Nous détaillerons à l’aide d’exemples l’analyse de survie descriptive par la méthodes Kaplan-Meier.

Particularités de l’analyse de survie

Premièrement et pour ce type d’analyse, la variable d’intérêt est le temps de survie. C’est une variable cinétique (temps) de type quantitatif. Sachant que lors de ce type d’étude, les dates de début de l’événement initial et les dates de survenue de l’évènement final (Décès) ne sont pas les mêmes pour tous les patients. Généralement, nous recrutons les patients au fur et à mesure, et non à une date fixe, comme cela se fait lors d’un essai clinique. Les dates de survenue de l’événement final varient également considérablement d’un patient à l’autre, ce qui est normal et fait l’objet de l’étude. Par conséquent, la variable temps de survie ne suit pas une distribution normale, et nous ne pouvons pas lui appliquer un modèle paramétrique.

Deuxièmement, ces études peuvent être menés sur des longues périodes de temps. Pour cela certains patients sont perdus de vue sans aucune donnée de l’événement final. Pour d’autres patients l’évènement final ne se produit pas avant l’arrêt de l’étude à la date de point. Dans les deux cas nous parlons de données censurées ou absences d’information.

Définitions des termes utilisés

Pour mieux comprendre les différents termes utilisés lors de cette analyse, nous présentons un exemple d’une étude de survie.

Les 7 patients ayant subi une chirurgie ont généré des données de suivi enregistrées dans la représentation ci-dessous. Le patient n°1 a subi une opération le 1er jour de la mise en place de l’étude en janvier 2010. Il a cessé de fournir des nouvelles (Date de dernière Nouvelle DN) en mai 2011, et à cette date, il était en vie (VV). Ce patient est maintenant considéré comme perdu de vue. Le patient n°2 a été inclus également en janvier 2010 et a enregistré un décès (DC) en juillet 2011. Le patient n°3 a été inclus et opéré en mars 2010. Sa date de dernière nouvelle (DN) est en décembre 2011, indiquant un statut vivant (VV). Cette date est postérieure à la date de point DP du mois d’octobre 2011, qui marque l’arrêt de l’étude.

Schéma de présentation des données et définition des termes

En résumé, parmi les 7 patients qui ont subi une opération, 3 ont succombé avant la date de point. Ces données sont non censurées. Quatre patients ont été perdus de vue, affichant le statut « Vivant » (VV). Deux d’entre eux ont été perdus de vue avant la date de point, tandis que les 2 autres l’ont été après la date de point. Les données relatives à ces 4 patients sont censurées, car aucune information n’est disponible sur la survenue de l’événement final « Décès ».

Généralement, on présente les données sous forme du tableau ci-dessous avec les dates et les statuts de chaque patient.

Tableau des données de survie

Dates et Termes importants lors de l’analyse de survie

Les dates permettent de calculer la durée du suivi pour chaque sujet ou le temps de participation à l’étude. 

Date d’Origine DO

La Date d’Origine DO est la date de début de surveillance d’un sujet. Cette date correspond à la date d’inclusion dans l’étude. Cela peut être par exemple lors d’une consultation, d’un diagnostic, d’un traitement ou une d’intervention chirurgicale. La Date d’Origine peut changer d’un sujet à un autre puisque les sujets ne sont pas tous recrutés en même temps.

Date de la dernière nouvelle DN

C’est la date de la dernière nouvelle d’un patient en vie VV ou Décédé. Là aussi la DN peut varier d’un sujet à un autre.

Date de Point DP « the endpoint date » en anglais

C’est la date à laquelle nous avons décidé de mettre fin à l’étude et de faire le point DP. Cependant cette date est la même pour tous les sujets.

Variable d’état ou status

C’est l’état du sujet aux dernières nouvelles. Deux modalités sont possibles soit le décès, soit l’absence de décès (Vivant ou perdu de vue).

Le Recul est le délai entre la date d’origine DO et la date de Point DP.

Le temps de participation est le délai écoulé entre le DO et le DN si celle-ci est antérieure à la date de point DP.

Comme mentionné, beaucoup de patients se perdent de vue, « lost to follow-up », lors d’une analyse de survie. À la date de point DP, le statut (vivant ou décès) de ces patients n’est pas connu. Ces patients présentent des données incomplètes, qualifiées de données censurées.

Données Censurées

En ce qui concerne les données censurées, elles représentent des situations où l’observation de la durée de vie d’un individu n’est pas complète. Cela se produit lorsque l’événement final « Décès » ne se produit pas avant la fin de la période de l’étude ou avant que l’individu ne soit perdu de vue. Dans les deux cas, il s’agit de données censurées à droite.

Les méthodes d’analyse de survie sont spécifiquement conçues pour prendre en compte ces données censurées et estimer les paramètres de survie malgré leur présence.

Temps de survie « survival time »

Le temps de survie est de temps écoulé entre le début du suivi DO et date de survenue de l’événement DC d’une part et entre la date DO et la date de censure (date de point DP) d’autre part. Ce délai de survie est la variable d’intérêt qui interviendra dans l’analyse statistique de survie. Il doit donc être estimé le plus précisément possible.

Fonction de survie et taux de survie à un instant t

Le taux de survie à un instant t est la probabilité pour qu’un patient survive au bout du temps t.

Taux de survie d'une analyse de survie

Si par exemple pour un groupe de malades, le taux de survie est de 0,9 à 5 ans, cela signifie qu’un malade a 90% de chance d’être en vie au bout de 5 ans.

Si par exemple pour un groupe de malades, le taux de survie est de 0,9 à 5 ans, cela signifie qu’un malade a 90% de chance d’être en vie au bout de 5 ans.

Une analyse de survie a pour objectif d’estimer la probabilité de survie à différents intervalles de temps. Normalement, il serait facile de calculer ce taux de survie si nous connaissons le statut vivant/ décédés de tous les patients à chaque instant de mesure. Seulement les données sont incomplètes à cause des perdus de vue. Le calcul du taux de survie à partir des données censurées n’est plus applicable. L’estimation du taux de survie se fait donc par un calcul des probabilités complètes. Il existe plusieurs méthodes d’estimation de la fonction de survie. Les méthodes de Kaplan-Meier et actuarielle sont toutes les deux des méthodes non paramétriques d’estimation de la fonction P(St).

Méthode Kaplan-Meier

Avec la méthode Kaplan-Meier, nous devons calculer les taux de survie ou la fonction de survie pas à pas à chaque instant ti

Pour mieux comprendre cette étape, considérons par exemple un groupe de patients N atteint d’une maladie, suivi pendant un intervalle de temps [0, α]. À la fin de l’étude, nous avons observé « d » décès et « l » perdus de vue. La période de suivi [0, α] est subdivisée en plusieurs intervalles de temps [ti, ti+1[, où ti est l’instant d’un décès et ti+1 est l’instant du décès suivant. À la date d’observation DO (t0), aucun décès ne survient, donc la probabilité de survie est égale à 1. Nous nous intéressons ainsi aux instants où se produisent des décès. Le temps est donc découpé en intervalles inégaux débutant à l’instant d’un décès et s’arrêtant juste avant le décès suivant.

Nous calculons ainsi la fonction de survie pour chaque intervalle de temps écoulé [ti, ti+1[, en utilisant le tableau de survie ci-dessous. »

Probabilités de survie Méthode Kaplan-Meier

Les probabilités de survie sont calculés pour chaque patient à chaque temps ou «intervalle de temps».

Tableau de calcul du taux de survie avec la méthode de Kaplan-Meier

avec: di= nombre de décès pendant l’intervalle [ti, ti+1[

li= nombre de perdus de vue pendant l’intervalle [ti, ti+1[

Ni= nombre de vivant pendant l’intervalle [ti, ti+1[

Ainsi pour chaque délai de survie, la probabilité de survie a été calculée pour chaque patient.

Probabilité de survie (pi) = 1 – probabilité de décès (di)

La probabilité de survie globale (si) est une fonction cumulative et représente le produit des probabilités à un temps ti-1 x ti.

Si = pi x si-1

qi= la probabilité de décès pendant l’intervalle [ti, ti+1[ ; qi=di/Ni

pi= la probabilité de survie pendant l’intervalle [ti, ti+1[ ; pi=1-qi

Si= la fonction de survie à l’instant ti ; Si=Si-1pi

L’analyse de survie tient compte des données censurées. Ce sont des données manquantes soit parce que les patients sont « perdus de vue » soit qu’ils sont vivants (l’évènement décès ne s’est pas produit). Faute d’avoir des dates de suivis, nous calculons les délais des données censurées en fixant une date de point DP.

Courbe de survie de Kaplan-Meier

L’analyse de survie par la méthode de Kaplan-Meier s’exprime par un graphique tracé en représentant la probabilité de survie cumulative en fonction du temps. Le temps en axe des abscisses et la probabilité de survie en axe des ordonnées. La courbe est en forme de marche d’escalier descendant dont le sommet représente 100% de survie. Chaque segment horizontal représente la probabilité de survie pendant un intervalle de temps. Le segment vertical représente la chute de la survenue au décès à l’instant ti.

Courbe de Kaplan-Meier

Exemple d’application du calcul du taux de survie

Supposons que nous menons une étude pour estimer la probabilité de survie chez des patients après une chirurgie complexe. Nous avons suivi 15 patients et enregistré le temps écoulé jusqu’à ce qu’ils décèdent ou jusqu’à la fin de l’étude.

Une fois que nous avons calculer les délais de survie ou le temps écoulé entre la date de décès et la date d’origine, nous tirons ce temps par ordre croissant.

Nous calculons ensuite la probabilité de survie pour chaque patient ou pour chaque durée de survie. C’est à dire à chaque temps écoulé entre la date de chirurgie et la date de décès.

Probabilité de survie (pi) = 1 – probabilité de décès (di)

Table de survie

Tableau de données pour l'analyse de survie

Nous pouvons ensuite tracer la courbe de survie qui illustrera mieux l’évolution de la survie. Les plateaux horizontaux ont pour abscisses l’intervalle de temps et pour ordonnées le taux de survie.

Courbe de survie de l'analyse de survie suite à une chirurgie

Interprétation des résultats de l’analyse de survie

A 5 mois, la probabilité de survie après la chirurgie est de 87%. Elle baisse à 67% à partir de 14 mois. A 35 mois (3 ans) la probabilité de survie chute à 53%. Enfin le taux de survie descend à 47% après 5 ans.

Les paramètres de survie

Mediane de survie

La médiane de survie correspond au temps pour lequel la probabilité cumulée de survie est égale à 0,5.

L’écart type de l’estimateur de Kaplan-Meier

L’écart type (ET) de la probabilité estimée de survie S(t) est donné par la formule :

Ecart type de l'éstimateur de survie

où di le nombre de décès survenant au temps ti et ni le nombre de sujets à risque en ti.

Intervalle de confiance de Kaplan-Meier

Les bornes de l’intervalle de confiance à 95 % de la probabilité de survie s’écrivent:

Les bornes de l'intervalle de confiance à 95 % de la probabilité de survie

Bonjour

Inscrivez-vous à notre newsletter et recevez nos nouveaux articles dans votre boîte de réception.

Nous ne spammons pas ! Consultez notre politique de confidentialité pour plus d’informations.

Bonjour

Inscrivez-vous à notre newsletter et recevez nos nouveaux articles dans votre boîte de réception.

Nous ne spammons pas ! Consultez notre politique de confidentialité pour plus d’informations.

Si cet article vous a été utile, Merci de le partager