Podcast
Questions and Answers
Quelle est l'utilité principale d'estimer la variance de l'estimateur de Kaplan-Meier ?
Quelle est l'utilité principale d'estimer la variance de l'estimateur de Kaplan-Meier ?
- Évaluer la précision de l'estimation de la fonction de survie. (correct)
- Déterminer le nombre optimal de sujets à inclure dans l'étude.
- Visualiser graphiquement la fonction de survie.
- Simplifier le calcul de la fonction de survie.
Sur quoi se base-t-on pour estimer la variance de l'estimateur de Kaplan-Meier ?
Sur quoi se base-t-on pour estimer la variance de l'estimateur de Kaplan-Meier ?
- La théorie de l'estimation par maximum de vraisemblance. (correct)
- L'expérience clinique des chercheurs.
- Des données de survie agrégées provenant d'études antérieures.
- Des simulations Monte Carlo.
Quelle est la propriété de la matrice de Variance-Covariance dans le contexte de l'estimateur de Kaplan-Meier ?
Quelle est la propriété de la matrice de Variance-Covariance dans le contexte de l'estimateur de Kaplan-Meier ?
- Elle contient des éléments non nuls en dehors de la diagonale.
- Elle est égale à la matrice identité.
- Elle est toujours singulière.
- Elle est diagonale. (correct)
Si $g(.)$ est une fonction différentiable et $g'(θ) ≠ 0$, comment la méthode delta est-elle utilisée pour estimer la variance de $g(θ)$ ?
Si $g(.)$ est une fonction différentiable et $g'(θ) ≠ 0$, comment la méthode delta est-elle utilisée pour estimer la variance de $g(θ)$ ?
Sachant que $\widehat{S}(t) = \prod_{i|t_i \leq t} (1 - \frac{d_i}{n_i})$, quelle est l'expression de la variance de $ln(\widehat{S}(t))$ ?
Sachant que $\widehat{S}(t) = \prod_{i|t_i \leq t} (1 - \frac{d_i}{n_i})$, quelle est l'expression de la variance de $ln(\widehat{S}(t))$ ?
Si vous avez calculé $V(ln(\widehat{S}(t)))$, comment estimez-vous $V(\widehat{S}(t))$ en utilisant la méthode delta ?
Si vous avez calculé $V(ln(\widehat{S}(t)))$, comment estimez-vous $V(\widehat{S}(t))$ en utilisant la méthode delta ?
Quelle est la formule utilisée pour calculer la variance de l'estimateur de Kaplan-Meier, et quel est le nom associé à cette formule ?
Quelle est la formule utilisée pour calculer la variance de l'estimateur de Kaplan-Meier, et quel est le nom associé à cette formule ?
Quelle est la signification de $P(b_{Lt} \leq S(t) \leq b_{Ut}) = 1 - \alpha$ dans le contexte des intervalles de confiance ponctuels sur la survie ?
Quelle est la signification de $P(b_{Lt} \leq S(t) \leq b_{Ut}) = 1 - \alpha$ dans le contexte des intervalles de confiance ponctuels sur la survie ?
Quel est le comportement asymptotique de $\sqrt{n}(\widehat{S}(t) - S(t))/S(t)$ ?
Quel est le comportement asymptotique de $\sqrt{n}(\widehat{S}(t) - S(t))/S(t)$ ?
Si $\widehat{\sigma}_{S_t}$ représente l'écart-type estimé de $S(t)$, comment est-il calculé ?
Si $\widehat{\sigma}_{S_t}$ représente l'écart-type estimé de $S(t)$, comment est-il calculé ?
Comment est donné un intervalle de confiance au seuil $(1 - \alpha)$ pour $S(t)$ en utilisant l'écart-type estimé $\widehat{\sigma}{S_t}$ et le fractile $z{\alpha/2}$ ?
Comment est donné un intervalle de confiance au seuil $(1 - \alpha)$ pour $S(t)$ en utilisant l'écart-type estimé $\widehat{\sigma}{S_t}$ et le fractile $z{\alpha/2}$ ?
Quel est un inconvénient de construire un intervalle de confiance avec la formule standard, et quelle solution est proposée pour résoudre ce problème ?
Quel est un inconvénient de construire un intervalle de confiance avec la formule standard, et quelle solution est proposée pour résoudre ce problème ?
Si $g(S(t))$ est une transformée de la fonction de survie, comment estime-t-on l'écart-type de $g(S(t))$ en utilisant la méthode delta ?
Si $g(S(t))$ est une transformée de la fonction de survie, comment estime-t-on l'écart-type de $g(S(t))$ en utilisant la méthode delta ?
Quelle transformation est souvent utilisée pour construire des intervalles de confiance pour la fonction de survie ?
Quelle transformation est souvent utilisée pour construire des intervalles de confiance pour la fonction de survie ?
Quel est l'objectif principal des bandes de confiance dans l'analyse de survie ?
Quel est l'objectif principal des bandes de confiance dans l'analyse de survie ?
Quelles sont les deux types de bandes de confiance les plus couramment utilisées ?
Quelles sont les deux types de bandes de confiance les plus couramment utilisées ?
Selon le texte, quelle est la meilleure pratique à adopter lors de l'utilisation des bandes de Nair ?
Selon le texte, quelle est la meilleure pratique à adopter lors de l'utilisation des bandes de Nair ?
Quelle est la formule de l'estimateur de Nelson-Aalen pour la fonction de risque cumulé, $H(t)$ ?
Quelle est la formule de l'estimateur de Nelson-Aalen pour la fonction de risque cumulé, $H(t)$ ?
Comment est obtenu l'estimateur de Breslow (ou Peterson) de la fonction de risque cumulé ?
Comment est obtenu l'estimateur de Breslow (ou Peterson) de la fonction de risque cumulé ?
Comment se comparent les estimateurs de Nelson-Aalen et de Breslow dans l'estimation de la fonction de risque cumulé ?
Comment se comparent les estimateurs de Nelson-Aalen et de Breslow dans l'estimation de la fonction de risque cumulé ?
Comment est estimée la variance de l'estimateur de Breslow ?
Comment est estimée la variance de l'estimateur de Breslow ?
Quels sont les deux choix asymptotiquement équivalents offerts pour l'estimateur de Nelson-Aalen ?
Quels sont les deux choix asymptotiquement équivalents offerts pour l'estimateur de Nelson-Aalen ?
Dans la comparaison des courbes de survie estimées par Kaplan-Meier, quelle précaution est essentielle lors de la comparaison de deux échantillons ?
Dans la comparaison des courbes de survie estimées par Kaplan-Meier, quelle précaution est essentielle lors de la comparaison de deux échantillons ?
Si les deux échantillons comparés diffèrent significativement en dehors de l'intervention étudiée, quelle conséquence cela peut-il avoir sur l'interprétation des courbes de survie ?
Si les deux échantillons comparés diffèrent significativement en dehors de l'intervention étudiée, quelle conséquence cela peut-il avoir sur l'interprétation des courbes de survie ?
Sur quoi sont fondées les statistiques utilisées pour comparer les courbes de survie estimées (test du LogRank) ?
Sur quoi sont fondées les statistiques utilisées pour comparer les courbes de survie estimées (test du LogRank) ?
Laquelle des affirmations suivantes décrit le mieux l'hypothèse nulle dans le contexte de la statistique LogRank ?
Laquelle des affirmations suivantes décrit le mieux l'hypothèse nulle dans le contexte de la statistique LogRank ?
Comment le nombre espéré d'événements au sein des groupes est-il obtenu dans le test du LogRank ?
Comment le nombre espéré d'événements au sein des groupes est-il obtenu dans le test du LogRank ?
Quelle est la signification d'une valeur positive de la statistique du LogRank pour comparer deux groupes dans une étude de survie ?
Quelle est la signification d'une valeur positive de la statistique du LogRank pour comparer deux groupes dans une étude de survie ?
Comment la statistique du LogRank, sous l'hypothèse nulle d'égalité des courbes de survie, est-elle distribuée asymptotiquement ?
Comment la statistique du LogRank, sous l'hypothèse nulle d'égalité des courbes de survie, est-elle distribuée asymptotiquement ?
Que représente l'expression $\sum_{i=1}^{r}(d_{1t_i} - e_{1t_i})$ dans le contexte du test de LogRank pour deux groupes (le test de Wilcoxon)?
Que représente l'expression $\sum_{i=1}^{r}(d_{1t_i} - e_{1t_i})$ dans le contexte du test de LogRank pour deux groupes (le test de Wilcoxon)?
Dans le test de Wilcoxon, comment la pondération par le nombre d'individus à risque au temps $t_i$ affecte-t-elle l'analyse ?
Dans le test de Wilcoxon, comment la pondération par le nombre d'individus à risque au temps $t_i$ affecte-t-elle l'analyse ?
Dans quelles circonstances l'utilisation de tests stratifiés de comparaison des survies est-elle particulièrement appropriée ?
Dans quelles circonstances l'utilisation de tests stratifiés de comparaison des survies est-elle particulièrement appropriée ?
Dans le contexte des tests stratifiés, quel est le rôle de la variable $X_1$ ?
Dans le contexte des tests stratifiés, quel est le rôle de la variable $X_1$ ?
Quelle est la procédure générale suivie dans les tests stratifiés pour comparer des survies ?
Quelle est la procédure générale suivie dans les tests stratifiés pour comparer des survies ?
Une fois que chaque statistique $v_s$ est récupérée avec une matrice de variance-covariance estimée de $V_s$, quelle est la statistique de test définie et comment est-elle distribuée ?
Une fois que chaque statistique $v_s$ est récupérée avec une matrice de variance-covariance estimée de $V_s$, quelle est la statistique de test définie et comment est-elle distribuée ?
Laquelle des affirmations suivantes représente en quoi consiste l'application de la méthode de Bonferroni au test de l'égalité entre k groupes si l'on considère un seuil de risque de a fixé ?
Laquelle des affirmations suivantes représente en quoi consiste l'application de la méthode de Bonferroni au test de l'égalité entre k groupes si l'on considère un seuil de risque de a fixé ?
Flashcards
Variance de l'estimateur de Kaplan-Meier
Variance de l'estimateur de Kaplan-Meier
Pour évaluer la précision de l'estimation de S(t), il est utile d'estimer la variance de S(t).
Matrice diagonale
Matrice diagonale
Matrice où les éléments non diagonaux sont nuls.
Intervalles de confiance ponctuels
Intervalles de confiance ponctuels
Deux bornes bLt et bUt telles que ∀t > 0 on ait : P(bLt ≤ S(t) ≤ bUt) = 1 − α, où α est un seuil de risque fixé.
Transformée de S(t)
Transformée de S(t)
Signup and view all the flashcards
Bandes de confiance
Bandes de confiance
Signup and view all the flashcards
Estimateur de Nelson-Aalen
Estimateur de Nelson-Aalen
Signup and view all the flashcards
Estimateur de Breslow
Estimateur de Breslow
Signup and view all the flashcards
Comparaison de courbes de survie
Comparaison de courbes de survie
Signup and view all the flashcards
Statistique LogRank
Statistique LogRank
Signup and view all the flashcards
Hypothèse nulle
Hypothèse nulle
Signup and view all the flashcards
Test de LogRank
Test de LogRank
Signup and view all the flashcards
Tests stratifiés
Tests stratifiés
Signup and view all the flashcards
Variable X1
Variable X1
Signup and view all the flashcards
Variable X2
Variable X2
Signup and view all the flashcards
Méthode de Bonferroni
Méthode de Bonferroni
Signup and view all the flashcards
Study Notes
- Il s'agit des notes d'étude sur l'analyse de la durée de vie selon Youssef Bennani
- La séance est le 3, et la date est le 22 février 2025
Variance de l'estimateur de Kaplan-Meier
- Il est utile d'estimer la variance de S(t) afin d'évaluer avec précision l'estimation de S(t).
- La théorie de l'estimation par le maximum de vraisemblance sert de fondation.
- La variance asymptotique de est évaluée par une formule spécifique.
- Il est rappelé qu'une formule de logarithme est utilisée, impliquant des sommes de termes avec décès (d), effectifs (n), et probabilités (π).
- On déduit que δ²l/δπi² = (ni - di)/πi² - di/(1 - πi)², et δ²l/δπiδπj = 0 quand i est différent de j.
- La matrice de variance-covariance est diagonale.
- Cette matrice est évaluée en πi = 1 - di/ni pour i ≠ j, et Cov(πi, πj) = 0
- La méthode delta stipule que si g(.) est une fonction différentiable avec g'(θ) ≠ 0, alors V(g(θ)) = g'²(θ)V(θ).
- V(ln(πi)) = πi⁻²V(πi) = di / ((ni - di)ni).
- Il est rappelé que S(t) = ∏(1 - di/ni) = ∏πi pour tous les i tels que ti ≤ t.
- V(ln(Ŝ(t))) = Σ(di/((ni - di)ni)) pour tous les i tels que ti ≤ t.
- Un objectif est d'estimer V(Ŝ(t)), appliquant la méthode delta avec g(.) = exp(.).
- V(Ŝ(t)) = Ŝ(t)²V(ln(Ŝ(t))) = Ŝ(t)² × σ²lnSt
- La formule résultante est connue sous le nom de Greenwood.
Intervalles de confiance ponctuels sur la survie
- Le but est de trouver deux bornes bLt et bUt telles que ∀t > 0, P(bLt ≤ S(t) ≤ bUt) = 1 − α, où α est un seuil de risque fixé à l'avance.
- On admet que √n(Ŝ(t) − S(t))/S(t) converge vers une martingale gaussienne centrée.
- Une des conséquences est que la distribution asymptotique de Ŝ(t) est gaussienne, centrée sur S(t).
- L'écart-type estimé, noté σ̂St, est σ̂St = σ̂lnStŜ(t).
- Un intervalle de confiance de (1 − α) est donné par Ŝ(t) ± zα/2σ̂St, où zα/2 est le fractile de rang α/2 de la distribution normale standardisée.
- Un inconvénient de cette construction d'intervalle de confiance est que les bornes peuvent être extérieures à l'intervalle [0, 1].
- Une solution consiste à utiliser une transformée de S(t) via une fonction g(.) continue, dérivable et inversible, de sorte que g(S(t)) appartienne à un espace plus large non borné qui approxime mieux une v.a. gaussienne.
- La méthode delta permet d'estimer l'écart-type de l'objet créé, défini par σ̂g(St) = g'(Ŝt)σ̂St
- L'intervalle de confiance associé au seuil de risque α est construit comme g⁻¹(g(Ŝt) ±zα/2g'(Ŝt)σ̂St)
- La transformation la plus utilisée est g(St) = ln[-ln(St)].
Bandes de confiance
- Il s'agit de trouver une région du plan contenant la fonction de survie avec une probabilité de 1 − α, ou un ensemble de bornes bLt et bUt encadrant S(t) pour tout t ∈ [tL, tU] avec cette probabilité.
- Les solutions les plus couramment utilisées sont les bandes de Hall-Wellner et les bandes de Nair.
- L'obtention technique de ces bandes est complexe, reposant sur la convergence vers une martingale gaussienne centrée et la théorie des processus browniens.
- En pratique, il est conseillé d'utiliser une transformation avec les bandes de Nair, contrairement aux bandes de Hall-Wellner où une transformation serait moins utile.
Estimation de la fonction de risque cumulé
- Nelson et Aalen ont proposé un estimateur de la fonction de risque cumulé H(t) donné par Ĥ(t) = ∑ di/ni pour tous les i tels que ti ≤ t.
- Un autre estimateur, celui de Breslow ou de Peterson, est obtenu à partir de l'estimateur KM, soit Ĥ(t) = -ln Ŝ(t).
- Il est démontré que Ĥ(t) < Ĥ(t): l'estimateur de Nelson-Aalen est toujours inférieur à celui de Breslow.
- Cela découle de la concavité de la fonction ln, qui se situe sous sa tangente, ce qui, via un développement de Taylor à l'ordre 1, implique ln(1 - x+) < x+.
- Aucune raison ne privilégie l'un par rapport à l'autre.
- La variance de l'estimateur de Breslow est estimée par V(Ĥ(t)) = V(Ŝ(t))/Ŝ(t)².
- Pour celui de Nelson-Aalen, deux choix asymptotiquement équivalents sont proposés: V(Ĥ(t)) = ∑ di(ni - di)/ni³ ou V(Ĥ(t)) = ∑ di²/ni² pour tous les i tels que ti ≤ t.
Comparaison des courbes de survie estimées par Kaplan-Meier
- Après avoir estimé les courbes de survie sur deux groupes ou plus, l'intérêt se porte sur leur comparaison.
- L'exemple typique est celui de deux échantillons issus de la même population, dont l'un subit une intervention.
- Il est primordial de s'assurer que, hormis l'intervention, les groupes possèdent les mêmes caractéristiques.
- Sinon, toute divergence ne peut être attribuée à l'intervention seule.
- Les statistiques utilisées reposent sur des tableaux de contingence des temps d'événements.
- Ce sont des statistiques de rang, avec la statistique du LogRank comme la plus courante.
Statistique LogRank : comparaison de deux groupes
- L'hypothèse nulle est l'égalité des courbes de survie.
- Sous H0, la proportion attendue d'événements à un temps ti quelconque est donnée par di/ni.
- Le nombre espéré d'événements dans chaque groupe est obtenu en appliquant cette proportion à l'effectif observé de chaque groupe.
- e1i = n1i * di / ni et e2i = n2i * di / ni = di − e1i
- Les règles de construction des données nécessaires aux calculs sont celles utilisées dans les calculs de KM.
- Le nombre d'individus à risque au temps ti est égal au nombre d'individus risqués en ti-1, diminué de l'effectif des individus ayant subi l'événement en ti-1 et de ceux censurés entre ti-1 (inclus) et ti (exclu).
- Une fois ces tables construites, quatre quantités sont calculées: O1 et O2 (nombre total d'événements observés dans chaque groupe), et E1 et E2 (nombre total d'événements attendus sous H0 pour chaque groupe).
- Oj = Σi dji et Ej = Σi eji pour j = 1,2
- O1 + O2 = E1 + E2.
- La statistique O1 - E1 est la statistique de LogRank.
- Exemple : Action marketing effectuée auprès des individus du groupe 2, avec pour événement la rupture de la relation client.
- On s'attend à ce que l'action améliore favorablement la courbe de survie et la fidélisation du client.
- Une valeur positive indique que le groupe 1 a plus d'événements observés que prévu sous H0, par rapport au groupe 2.
- Sous l'hypothèse nulle d'égalité des courbes de survie, (O1 - E1)²/E1 + (O2 - E2)²/E2 suit asymptotiquement une loi du Chi² à un degré de liberté.
Comparaison de k fonctions de survie
- L'extension à k groupes, approchée par chi², est immédiate.
- Sous H0 d'égalité des k courbes, la statistique (O1 - E1)²/E1 + (O2 - E2)²/E2 + ··· + (Ok - Ek)²/Ek est distribuée selon une loi du chi² avec k - 1 degrés de liberté.
- Si l'hypothèse nulle est rejetée, les couples de fonctions responsables de ce rejet sont recherchés.
- H0 étant une hypothèse jointe comme S1(t) = S2(t) = ··· = Sk(t), il faut contrôler le risque global.
- Selon la méthode de Bonferroni, pour un seuil de risque α donné, si nH hypothèses simples doivent être considérées, H0: Si(t) = Sj(t) est rejetée si son seuil de significativité est inférieur à α/nH.
Test de Wilcoxon
- Pour deux groupes, le test du LogRank a pour expression Σ(d1ti - e1ti) où r est le nombre d'événements observés sur les groupes 1 et 2.
- En accordant implicitement un poids unitaire à chaque quantité (d1ti - e1ti).
- Il est possible de construire des statistiques pondérées de la forme Σ wi( d1ti - e1ti)
- Modifier les wi ajuste l'influence des événements selon la durée de leur réalisation.
- Gehan propose wi = ni; où les poids sont égaux aux nombre d'individus à risque au temps ti
- Puisque ni dimunue avec ti, cette statistique accorde plus de poids aux évènements observés de courte durée.
Tests stratifiés de comparaison des survies
- Une hétérogénéité des sous-populations est soupçonnée, constituant chacune des strates que l'on vise à comparer.
- Si cette hétérogénéité est présente, les tests précités peuvent être déficients et leurs conclusions sujettes à caution.
- Si nous voulons comparer, par exemple, la durée d'accès à l'emploi de deux filières de formation, alors que la répartition par sexe des sortants n'est pas égale
- Dans ces conditions, il serait possible d'attribuer aux filières des conditions d'accès à l'emploi inégales entre les hommes et les femmes.
- Les tests stratifiés visent à prendre en compte ce type d'hétérogénéité.
- X1 est variable définissant les strates d'intérêt, et X2 variable définissant les sous-populations ''hétérogènes" au sein des strates précédentes
- Les tests stratifiés construisent des tests d'égalité des survies sur chaque sous-population identifiée par X2, et combinent les valeurs de tels tests
- Ce afin de fournir un test global d'égalité des survies pour les strates.
- Plus généralement, s'il y M strates de sous-populations créant de l'hétérogénéité, M statistiques vs, sont récupérées à la première étape.
- vs ont chacune une variance-covariance estimée Vs et M degrés de liberté df.
- Les quantités sont construites à la deuxième étape, v = somme des vs de s=1 à m et V = somme des Vs pour s=1 à m.
- La statistique de test stratifiée est V-1 v. Sous H0, V-1 est distribuée de façon asymptotique en tant que Chi2(df)
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.