Analyse de la Durée de Vie: Séance 3

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Quelle est l'utilité principale d'estimer la variance de l'estimateur de Kaplan-Meier ?

  • Évaluer la précision de l'estimation de la fonction de survie. (correct)
  • Déterminer le nombre optimal de sujets à inclure dans l'étude.
  • Visualiser graphiquement la fonction de survie.
  • Simplifier le calcul de la fonction de survie.

Sur quoi se base-t-on pour estimer la variance de l'estimateur de Kaplan-Meier ?

  • La théorie de l'estimation par maximum de vraisemblance. (correct)
  • L'expérience clinique des chercheurs.
  • Des données de survie agrégées provenant d'études antérieures.
  • Des simulations Monte Carlo.

Quelle est la propriété de la matrice de Variance-Covariance dans le contexte de l'estimateur de Kaplan-Meier ?

  • Elle contient des éléments non nuls en dehors de la diagonale.
  • Elle est égale à la matrice identité.
  • Elle est toujours singulière.
  • Elle est diagonale. (correct)

Si $g(.)$ est une fonction différentiable et $g'(θ) ≠ 0$, comment la méthode delta est-elle utilisée pour estimer la variance de $g(θ)$ ?

<p>$V(g(θ)) = [g'_0]^2 V(θ)$ (B)</p> Signup and view all the answers

Sachant que $\widehat{S}(t) = \prod_{i|t_i \leq t} (1 - \frac{d_i}{n_i})$, quelle est l'expression de la variance de $ln(\widehat{S}(t))$ ?

<p>$V(ln(\widehat{S}(t))) = \sum_{i|t_i \leq t} \frac{d_i}{(n_i - d_i)n_i}$ (D)</p> Signup and view all the answers

Si vous avez calculé $V(ln(\widehat{S}(t)))$, comment estimez-vous $V(\widehat{S}(t))$ en utilisant la méthode delta ?

<p>$V(\widehat{S}(t)) = \widehat{S}(t)^2 \times V(ln(\widehat{S}(t)))$ (A)</p> Signup and view all the answers

Quelle est la formule utilisée pour calculer la variance de l'estimateur de Kaplan-Meier, et quel est le nom associé à cette formule ?

<p>Formule de Greenwood. (B)</p> Signup and view all the answers

Quelle est la signification de $P(b_{Lt} \leq S(t) \leq b_{Ut}) = 1 - \alpha$ dans le contexte des intervalles de confiance ponctuels sur la survie ?

<p>Si l'expérience était répétée plusieurs fois, l'intervalle $[b_{Lt}, b_{Ut}]$ contiendrait la vraie valeur de $S(t)$ dans $100(1 - \alpha)%$ des cas. (B)</p> Signup and view all the answers

Quel est le comportement asymptotique de $\sqrt{n}(\widehat{S}(t) - S(t))/S(t)$ ?

<p>Converge vers une martingale gaussienne centrée. (B)</p> Signup and view all the answers

Si $\widehat{\sigma}_{S_t}$ représente l'écart-type estimé de $S(t)$, comment est-il calculé ?

<p>$\widehat{\sigma}<em>{S_t} = \widehat{\sigma}</em>{lS_t} \times \widehat{S}(t)$ (A)</p> Signup and view all the answers

Comment est donné un intervalle de confiance au seuil $(1 - \alpha)$ pour $S(t)$ en utilisant l'écart-type estimé $\widehat{\sigma}{S_t}$ et le fractile $z{\alpha/2}$ ?

<p>$S(t) \pm z_{\alpha/2} \times \widehat{\sigma}_{S_t}$ (D)</p> Signup and view all the answers

Quel est un inconvénient de construire un intervalle de confiance avec la formule standard, et quelle solution est proposée pour résoudre ce problème ?

<p>Les bornes peuvent être extérieures à l'intervalle [0, 1] / Transformer $S(t)$ via une fonction continue et inversible (A)</p> Signup and view all the answers

Si $g(S(t))$ est une transformée de la fonction de survie, comment estime-t-on l'écart-type de $g(S(t))$ en utilisant la méthode delta ?

<p>$\widehat{\sigma}<em>{g(S_t)} = g'(S_t) \times \widehat{\sigma}</em>{S_t}$ (D)</p> Signup and view all the answers

Quelle transformation est souvent utilisée pour construire des intervalles de confiance pour la fonction de survie ?

<p>$g(S_t) = ln[-ln(S_t)]$ (D)</p> Signup and view all the answers

Quel est l'objectif principal des bandes de confiance dans l'analyse de survie ?

<p>Déterminer deux bornes qui encadrent la fonction de survie sur un intervalle de temps avec une certaine probabilité. (C)</p> Signup and view all the answers

Quelles sont les deux types de bandes de confiance les plus couramment utilisées ?

<p>Bandes de Hall-Wellner et bandes de Nair. (D)</p> Signup and view all the answers

Selon le texte, quelle est la meilleure pratique à adopter lors de l'utilisation des bandes de Nair ?

<p>Utiliser une transformation. (A)</p> Signup and view all the answers

Quelle est la formule de l'estimateur de Nelson-Aalen pour la fonction de risque cumulé, $H(t)$ ?

<p>$H(t) = \sum_{i|t_i \leq t} \frac{d_i}{n_i}$ (B)</p> Signup and view all the answers

Comment est obtenu l'estimateur de Breslow (ou Peterson) de la fonction de risque cumulé ?

<p>Il est obtenu à partir de l'estimateur KM de la survie en utilisant la relation $H(t) = -ln(\widehat{S}(t))$. (C)</p> Signup and view all the answers

Comment se comparent les estimateurs de Nelson-Aalen et de Breslow dans l'estimation de la fonction de risque cumulé ?

<p>L'estimateur de Nelson-Aalen est toujours inférieur à l'estimateur de Breslow. (C)</p> Signup and view all the answers

Comment est estimée la variance de l'estimateur de Breslow ?

<p>Elle est estimée par la relation $V(\widehat{H}(t)) = \frac{V(\widehat{S}(t))}{\widehat{S}(t)^2}$. (A)</p> Signup and view all the answers

Quels sont les deux choix asymptotiquement équivalents offerts pour l'estimateur de Nelson-Aalen ?

<p>$V(\widehat{H}(t)) = \sum_{i|t_i \leq t} \frac{d_i(n_i - d_i)}{n_i^3}$ ou $V(\widehat{H}(t)) = \sum_{i|t_i \leq t} \frac{d_i}{n_i^2}$ (D)</p> Signup and view all the answers

Dans la comparaison des courbes de survie estimées par Kaplan-Meier, quelle précaution est essentielle lors de la comparaison de deux échantillons ?

<p>S'assurer que, à l'exception de l'intervention, les deux ensembles d'individus possèdent les mêmes autres caractéristiques. (D)</p> Signup and view all the answers

Si les deux échantillons comparés diffèrent significativement en dehors de l'intervention étudiée, quelle conséquence cela peut-il avoir sur l'interprétation des courbes de survie ?

<p>Cela peut rendre la divergence des courbes de survie difficile à attribuer uniquement à l'intervention. (B)</p> Signup and view all the answers

Sur quoi sont fondées les statistiques utilisées pour comparer les courbes de survie estimées (test du LogRank) ?

<p>Des tableaux de contingence des temps d'événements. (C)</p> Signup and view all the answers

Laquelle des affirmations suivantes décrit le mieux l'hypothèse nulle dans le contexte de la statistique LogRank ?

<p>Les courbes de survie sont égales. (B)</p> Signup and view all the answers

Comment le nombre espéré d'événements au sein des groupes est-il obtenu dans le test du LogRank ?

<p>En appliquant la proportion attendue d'événements (di/ni) à l'effectif observé de chaque groupe. (B)</p> Signup and view all the answers

Quelle est la signification d'une valeur positive de la statistique du LogRank pour comparer deux groupes dans une étude de survie ?

<p>Cela signifie qu'une action marketing diminue les chances qu'un client parte. (B)</p> Signup and view all the answers

Comment la statistique du LogRank, sous l'hypothèse nulle d'égalité des courbes de survie, est-elle distribuée asymptotiquement ?

<p>Selon une loi du Chi2 à un degré de liberté. (C)</p> Signup and view all the answers

Que représente l'expression $\sum_{i=1}^{r}(d_{1t_i} - e_{1t_i})$ dans le contexte du test de LogRank pour deux groupes (le test de Wilcoxon)?

<p>La somme des différences entre les événements observés et attendus dans le premier groupe. (D)</p> Signup and view all the answers

Dans le test de Wilcoxon, comment la pondération par le nombre d'individus à risque au temps $t_i$ affecte-t-elle l'analyse ?

<p>Accorde plus de poids aux événements survenant à des temps de survie plus courts. (D)</p> Signup and view all the answers

Dans quelles circonstances l'utilisation de tests stratifiés de comparaison des survies est-elle particulièrement appropriée ?

<p>Lorsqu'il existe une hétérogénéité au sein des strates que l'on veut comparer. (D)</p> Signup and view all the answers

Dans le contexte des tests stratifiés, quel est le rôle de la variable $X_1$ ?

<p>Elle sert à définir les strates d'intérêt. (C)</p> Signup and view all the answers

Quelle est la procédure générale suivie dans les tests stratifiés pour comparer des survies ?

<p>Construire des tests d'égalité des survies sur chaque strate, puis combiner les résultats pour obtenir un test global. (D)</p> Signup and view all the answers

Une fois que chaque statistique $v_s$ est récupérée avec une matrice de variance-covariance estimée de $V_s$, quelle est la statistique de test définie et comment est-elle distribuée ?

<p>$v V^{-1} v$, selon une loi du Chi2. (D)</p> Signup and view all the answers

Laquelle des affirmations suivantes représente en quoi consiste l'application de la méthode de Bonferroni au test de l'égalité entre k groupes si l'on considère un seuil de risque de a fixé ?

<p>Rejeter H0 : Si(t) = Sj(t) si son seuil de significativité est inférieur à a/NH. (A)</p> Signup and view all the answers

Flashcards

Variance de l'estimateur de Kaplan-Meier

Pour évaluer la précision de l'estimation de S(t), il est utile d'estimer la variance de S(t).

Matrice diagonale

Matrice où les éléments non diagonaux sont nuls.

Intervalles de confiance ponctuels

Deux bornes bLt et bUt telles que ∀t > 0 on ait : P(bLt ≤ S(t) ≤ bUt) = 1 − α, où α est un seuil de risque fixé.

Transformée de S(t)

Transformation de S(t) via une fonction g(.) continue, dérivable et inversible telle que g(S(t)) appartienne à un espace plus large.

Signup and view all the flashcards

Bandes de confiance

Trouver une région du plan qui contienne la fonction de survie avec une probabilité donnée.

Signup and view all the flashcards

Estimateur de Nelson-Aalen

Estimateur de la fonction de risque cumulée proposé par Nelson et Aalen, donné par H(t) = ∑ (di/ni).

Signup and view all the flashcards

Estimateur de Breslow

Estimateur de Breslow où H(t) = -ln S(t).

Signup and view all the flashcards

Comparaison de courbes de survie

Technique utilisée pour comparer les courbes de survie de deux ou plusieurs groupes d'individus.

Signup and view all the flashcards

Statistique LogRank

Statistique de rang couramment utilisée pour comparer les courbes de survie.

Signup and view all the flashcards

Hypothèse nulle

Hypothèse que les courbes de survie sont égales.

Signup and view all the flashcards

Test de LogRank

Test statistique qui attribue un poids unitaire à chaque différence entre les événements observés et attendus.

Signup and view all the flashcards

Tests stratifiés

Tests qui tiennent compte de l'hétérogénéité des sous-populations dans les strates comparées.

Signup and view all the flashcards

Variable X1

Variable définissant les strates d'intérêt dans les tests stratifiés.

Signup and view all the flashcards

Variable X2

Variable définissant les sous-populations hétérogènes au sein des strates dans les tests stratifiés.

Signup and view all the flashcards

Méthode de Bonferroni

Méthode qui ajuste le seuil de significativité pour tenir compte du nombre d'hypothèses testées.

Signup and view all the flashcards

Study Notes

  • Il s'agit des notes d'étude sur l'analyse de la durée de vie selon Youssef Bennani
  • La séance est le 3, et la date est le 22 février 2025

Variance de l'estimateur de Kaplan-Meier

  • Il est utile d'estimer la variance de S(t) afin d'évaluer avec précision l'estimation de S(t).
  • La théorie de l'estimation par le maximum de vraisemblance sert de fondation.
  • La variance asymptotique de est évaluée par une formule spécifique.
  • Il est rappelé qu'une formule de logarithme est utilisée, impliquant des sommes de termes avec décès (d), effectifs (n), et probabilités (π).
  • On déduit que δ²l/δπi² = (ni - di)/πi² - di/(1 - πi)², et δ²l/δπiδπj = 0 quand i est différent de j.
  • La matrice de variance-covariance est diagonale.
  • Cette matrice est évaluée en πi = 1 - di/ni pour i ≠ j, et Cov(πi, πj) = 0
  • La méthode delta stipule que si g(.) est une fonction différentiable avec g'(θ) ≠ 0, alors V(g(θ)) = g'²(θ)V(θ).
  • V(ln(πi)) = πi⁻²V(πi) = di / ((ni - di)ni).
  • Il est rappelé que S(t) = ∏(1 - di/ni) = ∏πi pour tous les i tels que ti ≤ t.
  • V(ln(Ŝ(t))) = Σ(di/((ni - di)ni)) pour tous les i tels que ti ≤ t.
  • Un objectif est d'estimer V(Ŝ(t)), appliquant la méthode delta avec g(.) = exp(.).
  • V(Ŝ(t)) = Ŝ(t)²V(ln(Ŝ(t))) = Ŝ(t)² × σ²lnSt
  • La formule résultante est connue sous le nom de Greenwood.

Intervalles de confiance ponctuels sur la survie

  • Le but est de trouver deux bornes bLt et bUt telles que ∀t > 0, P(bLt ≤ S(t) ≤ bUt) = 1 − α, où α est un seuil de risque fixé à l'avance.
  • On admet que √n(Ŝ(t) − S(t))/S(t) converge vers une martingale gaussienne centrée.
  • Une des conséquences est que la distribution asymptotique de Ŝ(t) est gaussienne, centrée sur S(t).
  • L'écart-type estimé, noté σ̂St, est σ̂St = σ̂lnStŜ(t).
  • Un intervalle de confiance de (1 − α) est donné par Ŝ(t) ± zα/2σ̂St, où zα/2 est le fractile de rang α/2 de la distribution normale standardisée.
  • Un inconvénient de cette construction d'intervalle de confiance est que les bornes peuvent être extérieures à l'intervalle [0, 1].
  • Une solution consiste à utiliser une transformée de S(t) via une fonction g(.) continue, dérivable et inversible, de sorte que g(S(t)) appartienne à un espace plus large non borné qui approxime mieux une v.a. gaussienne.
  • La méthode delta permet d'estimer l'écart-type de l'objet créé, défini par σ̂g(St) = g'(Ŝt)σ̂St
  • L'intervalle de confiance associé au seuil de risque α est construit comme g⁻¹(g(Ŝt) ±zα/2g'(Ŝt)σ̂St)
  • La transformation la plus utilisée est g(St) = ln[-ln(St)].

Bandes de confiance

  • Il s'agit de trouver une région du plan contenant la fonction de survie avec une probabilité de 1 − α, ou un ensemble de bornes bLt et bUt encadrant S(t) pour tout t ∈ [tL, tU] avec cette probabilité.
  • Les solutions les plus couramment utilisées sont les bandes de Hall-Wellner et les bandes de Nair.
  • L'obtention technique de ces bandes est complexe, reposant sur la convergence vers une martingale gaussienne centrée et la théorie des processus browniens.
  • En pratique, il est conseillé d'utiliser une transformation avec les bandes de Nair, contrairement aux bandes de Hall-Wellner où une transformation serait moins utile.

Estimation de la fonction de risque cumulé

  • Nelson et Aalen ont proposé un estimateur de la fonction de risque cumulé H(t) donné par Ĥ(t) = ∑ di/ni pour tous les i tels que ti ≤ t.
  • Un autre estimateur, celui de Breslow ou de Peterson, est obtenu à partir de l'estimateur KM, soit Ĥ(t) = -ln Ŝ(t).
  • Il est démontré que Ĥ(t) < Ĥ(t): l'estimateur de Nelson-Aalen est toujours inférieur à celui de Breslow.
  • Cela découle de la concavité de la fonction ln, qui se situe sous sa tangente, ce qui, via un développement de Taylor à l'ordre 1, implique ln(1 - x+) < x+.
  • Aucune raison ne privilégie l'un par rapport à l'autre.
  • La variance de l'estimateur de Breslow est estimée par V(Ĥ(t)) = V(Ŝ(t))/Ŝ(t)².
  • Pour celui de Nelson-Aalen, deux choix asymptotiquement équivalents sont proposés: V(Ĥ(t)) = ∑ di(ni - di)/ni³ ou V(Ĥ(t)) = ∑ di²/ni² pour tous les i tels que ti ≤ t.

Comparaison des courbes de survie estimées par Kaplan-Meier

  • Après avoir estimé les courbes de survie sur deux groupes ou plus, l'intérêt se porte sur leur comparaison.
  • L'exemple typique est celui de deux échantillons issus de la même population, dont l'un subit une intervention.
  • Il est primordial de s'assurer que, hormis l'intervention, les groupes possèdent les mêmes caractéristiques.
  • Sinon, toute divergence ne peut être attribuée à l'intervention seule.
  • Les statistiques utilisées reposent sur des tableaux de contingence des temps d'événements.
  • Ce sont des statistiques de rang, avec la statistique du LogRank comme la plus courante.

Statistique LogRank : comparaison de deux groupes

  • L'hypothèse nulle est l'égalité des courbes de survie.
  • Sous H0, la proportion attendue d'événements à un temps ti quelconque est donnée par di/ni.
  • Le nombre espéré d'événements dans chaque groupe est obtenu en appliquant cette proportion à l'effectif observé de chaque groupe.
  • e1i = n1i * di / ni et e2i = n2i * di / ni = di − e1i
  • Les règles de construction des données nécessaires aux calculs sont celles utilisées dans les calculs de KM.
  • Le nombre d'individus à risque au temps ti est égal au nombre d'individus risqués en ti-1, diminué de l'effectif des individus ayant subi l'événement en ti-1 et de ceux censurés entre ti-1 (inclus) et ti (exclu).
  • Une fois ces tables construites, quatre quantités sont calculées: O1 et O2 (nombre total d'événements observés dans chaque groupe), et E1 et E2 (nombre total d'événements attendus sous H0 pour chaque groupe).
  • Oj = Σi dji et Ej = Σi eji pour j = 1,2
  • O1 + O2 = E1 + E2.
  • La statistique O1 - E1 est la statistique de LogRank.
  • Exemple : Action marketing effectuée auprès des individus du groupe 2, avec pour événement la rupture de la relation client.
  • On s'attend à ce que l'action améliore favorablement la courbe de survie et la fidélisation du client.
  • Une valeur positive indique que le groupe 1 a plus d'événements observés que prévu sous H0, par rapport au groupe 2.
  • Sous l'hypothèse nulle d'égalité des courbes de survie, (O1 - E1)²/E1 + (O2 - E2)²/E2 suit asymptotiquement une loi du Chi² à un degré de liberté.

Comparaison de k fonctions de survie

  • L'extension à k groupes, approchée par chi², est immédiate.
  • Sous H0 d'égalité des k courbes, la statistique (O1 - E1)²/E1 + (O2 - E2)²/E2 + ··· + (Ok - Ek)²/Ek est distribuée selon une loi du chi² avec k - 1 degrés de liberté.
  • Si l'hypothèse nulle est rejetée, les couples de fonctions responsables de ce rejet sont recherchés.
  • H0 étant une hypothèse jointe comme S1(t) = S2(t) = ··· = Sk(t), il faut contrôler le risque global.
  • Selon la méthode de Bonferroni, pour un seuil de risque α donné, si nH hypothèses simples doivent être considérées, H0: Si(t) = Sj(t) est rejetée si son seuil de significativité est inférieur à α/nH.

Test de Wilcoxon

  • Pour deux groupes, le test du LogRank a pour expression Σ(d1ti - e1ti) où r est le nombre d'événements observés sur les groupes 1 et 2.
  • En accordant implicitement un poids unitaire à chaque quantité (d1ti - e1ti).
  • Il est possible de construire des statistiques pondérées de la forme Σ wi( d1ti - e1ti)
  • Modifier les wi ajuste l'influence des événements selon la durée de leur réalisation.
  • Gehan propose wi = ni; où les poids sont égaux aux nombre d'individus à risque au temps ti
  • Puisque ni dimunue avec ti, cette statistique accorde plus de poids aux évènements observés de courte durée.

Tests stratifiés de comparaison des survies

  • Une hétérogénéité des sous-populations est soupçonnée, constituant chacune des strates que l'on vise à comparer.
  • Si cette hétérogénéité est présente, les tests précités peuvent être déficients et leurs conclusions sujettes à caution.
  • Si nous voulons comparer, par exemple, la durée d'accès à l'emploi de deux filières de formation, alors que la répartition par sexe des sortants n'est pas égale
  • Dans ces conditions, il serait possible d'attribuer aux filières des conditions d'accès à l'emploi inégales entre les hommes et les femmes.
  • Les tests stratifiés visent à prendre en compte ce type d'hétérogénéité.
  • X1 est variable définissant les strates d'intérêt, et X2 variable définissant les sous-populations ''hétérogènes" au sein des strates précédentes
  • Les tests stratifiés construisent des tests d'égalité des survies sur chaque sous-population identifiée par X2, et combinent les valeurs de tels tests
  • Ce afin de fournir un test global d'égalité des survies pour les strates.
  • Plus généralement, s'il y M strates de sous-populations créant de l'hétérogénéité, M statistiques vs, sont récupérées à la première étape.
  • vs ont chacune une variance-covariance estimée Vs et M degrés de liberté df.
  • Les quantités sont construites à la deuxième étape, v = somme des vs de s=1 à m et V = somme des Vs pour s=1 à m.
  • La statistique de test stratifiée est V-1 v. Sous H0, V-1 est distribuée de façon asymptotique en tant que Chi2(df)

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Test 1
20 questions

Test 1

AstoundingCarnelian5257 avatar
AstoundingCarnelian5257
Análisis de Supervivencia (Parte I)
12 questions
Use Quizgecko on...
Browser
Browser