Missing Data in Clinical Research Analysis PDF
Document Details
Uploaded by PoisedTheme1847
Nantes Université
Véronique Sébille
Tags
Related
Summary
This document discusses missing data in clinical research, outlining different types of missing data mechanisms such as Missing Completely at Random (MCAR), Missing at Random (MAR), and Missing Not at Random (MNAR). It explores the impact of missing data on bias and precision in statistical analyses and provides strategies for managing missing data in research studies. The document highlights the importance of considering the mechanisms underlying missing data to draw valid inferences.
Full Transcript
FAIT Did You Say “Missing Data?” Véronique Sébille UMR INSERM U1246 SPHERE “methodS in Patient-centered outcomes & HEalth ResEarch” Universités de Nantes et de Tours https://sphere-inserm.fr/ Missing Data...
FAIT Did You Say “Missing Data?” Véronique Sébille UMR INSERM U1246 SPHERE “methodS in Patient-centered outcomes & HEalth ResEarch” Universités de Nantes et de Tours https://sphere-inserm.fr/ Missing Data in Clinical Research Multiple Reasons – Patient withdrawal of consent – Lost to follow-up – Death – "Forgetfulness," relocation, etc. – Logistical/technical issues –… Link to the tested therapeutic intervention? L LETENNEUR, ADELF 2 Structure of Missing Data Monotone or non-monotone structure ? Dropouts Intermittent missing ? ? data Lost to follow-up ? ? Ineffective treatment Forgotten visit ? ? ? Death Other illness ? ? ? ? … Invalid measurement ? ? … Monotone Drop outs Non-monotone structure + Intermittent missing structure data ? ? ? cohorts ? ? ? ? ? ? ? ? Non-monotone 3 structure Reminders ? – Bias and Precision Missing data may cause issues with bias and precision Bias ? Precision ? 4 4 Statistical Inference (reminders...) 5 5 Reminders ? – Bias and Precision Bias -- AND precision ++ Bias -- AND precision -- Bias ++ Bias ++ AND precision -- AND precision ++ 6 6 Nature of Missing Data – Rubin's Classification MCAR : Missing completely at random – No discernable difference between subjects with or without missing data ### MCAR : **Données manquantes complètement aléatoires** Définition :** Les données sont considérées comme **manquantes complètement aléatoires (MCAR)** lorsqu'il n'existe **aucune différence identifiable** entre les sujets pour lesquels des données sont manquantes et ceux pour lesquels toutes les données sont disponibles. – The probability of a missing observation is the same for all patients and groups,… E.g.: Limited funding leading to incomplete follow-up in a longitudinal study - **Probabilité de données manquantes :** La probabilité qu'une observation soit manquante est **identique pour tous les individus**, quel que soit leur groupe ou leurs caractéristiques. - **Conséquence :** Les données manquantes ne sont pas liées ni aux variables observées ni à celles non observées. **Exemple :** Dans une étude longitudinale (avec des suivis réguliers), un financement limité peut empêcher le suivi complet des participants. Les données manquantes résultent alors d’un facteur externe, totalement indépendant des patients ou des groupes. **En résumé :** 7 Les données manquantes en situation MCAR sont entièrement dues au hasard, et leur absence ne dépend ni des valeurs des données ni des caractéristiques des participants. MCAR : Missing completely at random Soient : – R = 1 if missing data, 0 otherwise – Y = endpoint (e.g.: PAS, pain score, death…) – X = covariable (e.g.: treatment/intervention, gender, age…) Missing data R (=1) does not depend on Y nor X X R Y What is/are the major problem(s) with MCAR data? Loss of precision 8 MCAR : Missing at random (or ignorable) MAR : Missing at random (or ignorable) – Missing data depends on other observed characteristics, not on the missing measurement itself – Probability of missing data depends on observed variables like age and gender ### MAR : **Données manquantes à condition d’être aléatoires** - Les données manquantes dépendent de **variables observées** (ex. âge, sexe), mais **pas de la valeur de la donnée manquante elle-même**. - **Exemple :** Une donnée est plus souvent manquante chez les patients âgés, mais sans lien direct avec la valeur réelle manquante. - **Implication :** On peut utiliser les variables observées pour corriger ou imputer les données manquantes. 9 MAR : Missing at random (or ignorable) Let: – R = 1 if missing data, 0 otherwise – Yobs = observed endpoint – Ym = non-observed endpoint (missing) – X = observed covariable Missing observations depend on known (observed) quantities What is/are the major problem(s) with MAR data? Possible bias (but should be able to be corrected) 10 Loss of precision MNAR : Missing not at random (or non ignorable, informative) MNAR : Missing not at random (or non ignorable, informative) – Missing data are not at random, cannot be inferred from other variables AND depends on the missing measurement that should have been observed – The probability of a missing observation depends on unobserved variables Ex : Cognitive function monitoring ends when impairment necessitates institutionalization 11 MNAR : Missing not at random (or non ignorable, informative) The probability of a missing observation depends on unobserved variables Missing observation depends on unknown quantities What is/are the major problem(s) with MNAR data? Very likely bias ++++Bias correction is based on unverifiable assumptions Loss of precision 12 ▪ Phase III randomized double-blind comparative trial ▪ Patients with advanced renal cell carcinoma ▪ Two arms // (axitinib versus sorafenib) ▪ Primary endpoint: progression-free survival ▪ Secondary endpoint: quality of life (score 0-100) ▪ Measurement times: randomization, M2, M3 and M4 Figures : changes in QoL scores during 4-month follow-up according to treatment group and (early) study termination date Any comments ?? 13 Melanie L Bell et al. BMJ 2013;346:bmj.e8668 Figures : changes in QoL scores during 4-month follow-up according to treatment group and study exit date Any comments ?? Overall: trajectories differ according to date of early study termination Patients with lower mean QoL scores at baseline more likely to leave study prematurely + especially in experimental arm Suspicion of treatment-related MNAR data If only observed data are taken into account Consequences ? 14 Melanie L Bell et al. BMJ 2013;346:bmj.e8668 Specific Issues with Missing Data Selection and attrition bias If there is a relationship between the occurrence of missing data and... The evaluated intervention Patient's state of health SOLUTIONS ? No missing data!! Robustness of results (and if DM were... would the results change?) 15 SOLUTIONS ? Study planning and follow-up++ Minimize the amount of missing data – Emphasize and ensure good communication with participants (patients, investigators, caregivers, etc.) – Persistent pursuit of the goal => complete follow-up for everyone – Implementation of several follow-up strategies Obtain a maximum of informations on missing data – What are the reasons for missing data? – Other informations occurrence of missing data (antcds, compliance, …) BUT let's suppose that despite everything … 16 Numerous problems caused by Missing Data Loss of power (/ expected power without missing data) – Inability to recover lost power, regardless of the statistical analysis Whatever the statistical analysis … – Unverifiable assumptions about missing data Incorrect assumptions biased estimations erroneous conclusions 17 Some remarks … Amount of missing data (MD) AND Mecanism(s) explaning the occurrence of MD What impact do MD have on the risk of misinterpretation? – Several factors to consider Type of endpoint Intervention Enpoint - Quantitative - Qualitative - Censored MD Expected variations of variables 18 Doing and undoing......... Strategy chosen to manage DM can itself be biased! No universal approach, but a few “best practice” recommendations – Important reflection on the assumptions made (DM) Closely linked to the context – Foresee a priori when planning the study How to avoid MD as much as possible How to manage them + sensitivity analyses (which ones?) 19 What can we do? An adequate method should – Make “reasonable assumptions” about missing data – Provide unbiased estimates (under these assumptions) Reliable P-values and confidence intervals – Be efficient (use as much available data as possible) BUT we can never be certain of the relevance of these hypotheses Sensitivity analyses are essential 20 20 Possible Methods and Recommendations Elements to consider when choosing possible methods – Difference between groups? MD rate Delays of occurrence of MD – Possibles causes of MD – Direction of spontaneous changes (endpoints, covariates, …) 21 Possible Methods and Recommendations Complete case analysis What do you think? – Not recommended as the main analysis(≠ ITT + selection bias) May be considered for sensitivity analyses (to assess the robustness of conclusions) Valid if missing data are … What do you think? …MCAR Simple imputation methods – Mean imputation – « Not great » : variance too small (inter-variability is neglected) – Last Observation Carried Forward (LOCF) To be avoided: bias++, very strong assumption of no evolution, distortion of intra and inter variability... 22 Simple imputation methods – LOCF **Conséquences potentielles :** 1. **Effet sur les résultats :** - La méthode LOCF peut produire des résultats **trop optimistes**. Par exemple, si un traitement est supposé ralentir le déclin mais que les données manquantes sont remplies par des valeurs anciennes (moins dégradées), l'effet bénéfique du traitement peut être surestimé. ### Imputation simple par méthode **LOCF** (Last Example : Alzheimer disease and LOCF Observation Carried Forward) **Définition et exemple :** La méthode LOCF consiste à utiliser la dernière valeur connue d’un patient pour remplacer les données – Natural course of the disease → decline manquantes. - **Exemple :** Dans une étude sur la maladie d'Alzheimer, la progression naturelle de la maladie implique un déclin progressif des capacités cognitives. Si la dernière mesure disponible (avant que le patient ne quitte l'étude) est utilisée pour combler les données manquantes, cela peut fausser les résultats. What do you think would be the consequences of using the LOCF imputation method? – LOCF may produce over-optimistic effects in the groups compared – If, in addition, the time to onset of MD is ≠ depending on the group accentuation of bias 2. **Impact en cas de différences entre groupes :** - Si le temps avant l’apparition d’une détérioration (comme un déficit cognitif majeur) **varie entre les groupes**, cette méthode peut **accentuer les biais**. Par exemple, si un groupe décline plus rapidement que l’autre, utiliser les valeurs précédentes pourrait masquer ces différences et fausser la comparaison. **En résumé :** La méthode LOCF, bien que simple, peut introduire des biais importants dans les études longitudinales, particulièrement lorsque les données manquantes concernent des mesures qui changent avec le temps (comme dans les maladies progressives). 23 Simple imputation methods – LOCF Simple imputation methods – LOCF – To be avoided (bias, very strong assumption of no evolution) Example : psychiatric illnesses (depression) and LOCF – Natural course of the disease → possible improvement What do you think would be the consequences of using the LOCF imputation method? – LOCF may produce under-optimistic effects in the groups compared – Especially if delay in onset of MD >> treated group / control and more frequent 24 Simple imputation methods – BOCF ### Méthode d'imputation simple – **BOCF** (Baseline Observation Carried Forward) **Définition :** La méthode **BOCF** consiste à utiliser la valeur initiale (baseline) pour remplacer toutes les données manquantes. Cela signifie que l'on suppose qu'un patient, en l'absence d'autres données, revient à son état de départ. Simple imputation methods – BOCF **Quand l'utiliser ?** Cette méthode peut être envisagée dans certains contextes, comme : - **Maladies chroniques impliquant des symptômes fluctuants** (par exemple, la douleur). – Baseline Obsevation Carried Forward - Quand il est **raisonnable de supposer** que, sans intervention durable, les symptômes du patient reviendront au même niveau qu’au début de l’étude. **Exemple :** Dans une étude évaluant un traitement contre la douleur : - Si un patient ne termine pas l’étude ou a des données manquantes, on considère que la douleur revient à son niveau initial avant traitement. - Cette hypothèse peut être valable si les traitements étudiés n’ont **pas d’effet à long terme** sur la douleur dans cette population. – Can be considered for **Limite de cette méthode :** - Elle peut sous-estimer l’efficacité réelle d’un traitement si, en réalité, les patients auraient continué à ressentir des bénéfices au-delà de leur participation. - Comme toutes les méthodes simples, elle ne prend pas en compte les trajectoires Chronic diseases assessing pain individuelles ou l’évolution réelle des symptômes au cours du temps. **Résumé :** La méthode **BOCF** est utile dans les études où il est plausible que les patients retournent à leur état initial (baseline) en l’absence de données, mais elle peut Reasonable to assume → pain returns to initial level entraîner une **sous-estimation des effets durables des traitements**. No or littke long-term benefit of treatment in these patients 25 Simple imputation methods – Other approaches Simple imputation methods – Other approaches Les méthodes – Imputation of values from other patients with similar profiles d'imputation simples suivantes peuvent être utilisées pour traiter les données manquantes. at inclusion (d° of similarity to be defined, cf hot deck) a Voici leur explication : 1. **Imputation basée possibility of introducing randomness sur des profils 2-Valeurs prédites à partir d’un modèle de régression** similaires** - **Principe** : Utiliser un modèle statistique (comme la régression) - **Principe** : pour prédire les valeurs manquantes en fonction des autres Remplacer les données variables disponibles. manquantes d’un Difficulty in defining similarities - **Possibilité d'incertitude** : On peut intégrer une **marge d’ patient par des valeurs incertitude** dans la prédiction pour refléter le caractère incertain provenant d’autres de la valeur imputée. patients ayant un - **Qualité dépendante des hypothèses** : L’efficacité de l’ **profil similaire** au Variance estimation often biased (too low) imputation dépend fortement des **données incluses dans le début de l’étude modèle** et des hypothèses formulées. (inclusion). - **Attention : "Garbage in, garbage out" (GIGO)** - **Exemple** : Si - Si le modèle est mal conçu ou si les données utilisées sont de deux patients ont des mauvaise qualité, les imputations seront également erronées. Un caractéristiques – Predicted values of a regression model: model prediction modèle inadapté produit des résultats peu fiables. similaires (âge, sexe, diagnostic), les valeurs manquantes de l’un replaces missing data peuvent être imputées à partir des données de l’autre. - **Problèmes potentiels** : - **Définir la similarité** : Cela peut être subjectif ou Possibility of incorporating a degree of uncertainty into the complexe, nécessitant des critères précis. - **Introduction d’ prediction aléatoire** : Ce processus peut introduire de la **variabilité arbitraire** Quality of imputation depends on what you put into the model dans les données. (assumptions underlying MD) Résumé : - **Estimation de la - Les imputations basées sur des profils similaires sont variance biaisée** : simples mais risquent d’ajouter de l’aléatoire et de biaiser Souvent, cette la variance. méthode **sous- - Les imputations par régression sont plus sophistiquées, estime la variance**, ce qui peut donner une illusion de précision Beware of the"GIGO" => mais leur succès repose sur la qualité des données et des hypothèses. - Dans les deux cas, il faut être vigilant sur les choix Garbage in garbage out dans les résultats. méthodologiques pour éviter de dégrader la qualité des résultats. 26 Simple imputation methods – Other approaches Simple imputation methods – Other approaches ## Méthodes d'imputation simples – Approches (“caricatured” but potentially useful) supplémentaires Ces approches sont parfois décrites comme "caricaturales" mais peuvent être utiles dans des – Worst/best case imputation 2. **Hypothèse de biais maximal :** contextes spécifiques, notamment pour tester des hypothèses extrêmes dans une analyse. - Cette méthode pousse le raisonnement plus loin : - Les **pires valeurs** sont imputées pour le groupe expérimental (celui Worst : worst values are imputed (e.g.--- quality of life: lowest recevant le traitement). - Les **meilleures valeurs** sont imputées pour le groupe témoin (celui score) qui ne reçoit pas le traitement). **Objectif :** Ces approches visent à explorer les Best : the most favorable value is imputed (e.g. quality of life: **scénarios extrêmes** et à réaliser des **analyses de sensibilité** pour tester la robustesse des conclusions. best score) 1. **Imputation du pire/des meilleurs cas :** - **Principe** : Les valeurs manquantes sont remplacées par des valeurs extrêmes : - Si les résultats restent similaires - **Pire cas** : On impute les **pires valeurs possibles**. même dans ces scénarios extrêmes, - Exemple : Dans une étude sur la qualité de vie, une valeur manquante serait imputée par le score **le plus bas**. cela renforce la **confiance** dans les - **Meilleur cas** : On impute les **meilleures valeurs possibles**. conclusions de l’étude. - À l'inverse, si les résultats changent - Exemple : Pour la qualité de vie, une valeur manquante serait remplacée par le **score maximal**. drastiquement, cela met en évidence – "Maximum bias” hypothesis une sensibilité élevée aux données manquantes. Worst value imputed in the experimental group and best value imputed in the control group Limites : - **Simplification excessive :** Ces méthodes ne reflètent pas toujours la réalité des données manquantes. Objective : sensitivity analyses - **Extrémisme délibéré :** Ces scénarios sont très conservateurs et ne doivent pas être interprétés comme des résultats probables. Résumé : L'imputation du pire/des meilleurs cas et l’hypothèse de biais maximal permettent d’évaluer l’impact potentiel des données manquantes sur les résultats d’une étude, mais elles servent uniquement comme outil d’analyse de sensibilité, pas comme méthode principale pour gérer les données manquantes. 27 Other possible methods and Méthodes d'imputation multiple Les méthodes d'imputation multiple permettent de surmonter les limites des méthodes d'imputation simples recommendations en intégrant plus de rigueur et en tenant compte de l'incertitude liée aux données manquantes. Avantages de l'imputation multiple :** - Offre une méthode plus réaliste pour gérer l'incertitude des données Multiple imputation methods manquantes. - Permet une estimation correcte de la variabilité et améliore la validité des résultats statistiques. Résumé :** L’imputation multiple est une méthode robuste et statistiquement valide pour gérer les données manquantes. Elle nécessite cependant des choix méthodologiques réfléchis et une planification rigoureuse pour garantir la – Overcoming the drawbacks of simple imputation fiabilité des analyses. Under-estimated variability Éléments clés à respecter :** - **Le choix du modèle Failure to take account of imputation uncertainty d'imputation est crucial :** - Le modèle utilisé pour générer les – Choice of imputation model(s) is crucial imputations doit être bien défini et prendre en compte toutes les variables pertinentes. - Si le modèle est mal Comment fonctionne l'imputation multiple ?** conçu, il peut biaiser 1. Plusieurs modèles d'imputation sont utilisés pour les résultats (principe générer des valeurs plausibles pour les données Pourquoi utiliser l'imputation multiple ?** "Garbage In, Garbage manquantes. 1. **Réduction de la variabilité sous-estimée Out"). 2. Plusieurs ensembles de données sont créés avec ces :** imputations. - Les méthodes d'imputation simples - **Définir le modèle a 3. Les analyses statistiques sont réalisées séparément (comme LOCF ou BOCF) ont tendance à priori dans le protocole sur chaque ensemble. **sous-estimer la variabilité des données**, :** 4. Les résultats finaux sont obtenus en **moyennant** ce qui peut rendre les résultats trop - L’approche pour les résultats des analyses des différents ensembles, tout optimistes ou faux. gérer les données en prenant en compte la variabilité entre eux. 2. **Prise en compte de l'incertitude liée à manquantes doit être l'imputation :** – To be defined a priori in the protocol décidée **avant** de - L'imputation multiple génère plusieurs commencer l’étude jeux de données complets en imputant des pour éviter toute valeurs différentes pour chaque donnée manipulation subjective des manquante. Cela reflète mieux 28 l'**incertitude** autour des valeurs estimées résultats. Multiple imputations Generate several "plausibles" MD values Objectives ARE NOT to – Predict MD with good precision – Provide an optimal description of data Objectifs ARE to – Reflect DM uncertainty as closely as possible – Preserve distributions as far as possible – Preserve relationships between variables as far as possible 29 Multiple imputations Simulation-based approach (imputation models) for analyzing incomplete data + HYPOTHESES 1st step : replace each MD with m>1 values 30 Multiple imputations 2nd step : identical statistical analysis of m completed files 3ème étape : combine the results 31 In practice... We obtain (OR, RR, HR, …) Estimation "MI" : Two imputation variances: variance intra and inter Total variance (Vtot) = sum + weighted by m Confidence interval: depends on Vtot and m 32 Imputation multiple et hypothèses sur les données manquantes L’imputation multiple repose sur des hypothèses concernant la nature des données manquantes. Ces Multiple imputations hypothèses ne sont souvent pas vérifiables directement, mais elles influencent la fiabilité des imputations. Hypothèse principale : "MAR" (Missing At Random)** - **Définition :** On suppose que les données manquantes dépendent uniquement des données **observées**, et **pas** des valeurs des données manquantes elles-mêmes. - Exemple : Un patient manque une mesure parce que son âge ou son sexe (données observées) influencent sa Hypothesis (unverifiable) probabilité d’être absent lors de cette mesure. - Cette hypothèse est fréquente en imputation multiple, car elle permet d’utiliser les données disponibles pour prédire celles qui manquent. – Hope => missing data only depend on observed data … Résumé :** Limite : Si les données sont "MNAR" not on missing data! - **MAR** est une hypothèse clé en imputation multiple, mais elle **ne peut pas être prouvée directement**. (Missing Not At Random)** - **Définition :** Les données manquantes dépendent de la **valeur manquante elle- - Si les données manquantes sont en réalité **MNAR**, même**, et non uniquement des données les imputations seront moins fiables et pourraient observées. fausser les conclusions. Cela souligne l’importance d - Exemple : Un patient en mauvaise santé ’évaluer soigneusement les hypothèses sur les (valeur manquante) peut être moins enclin données avant de choisir une méthode d’imputation. à participer ou à fournir des réponses. – E.g. "MAR" (Missing At Random) data - Problème : Si les données sont MNAR, les imputations basées sur MAR risquent d ’être **biaisées**, car le modèle ne prend pas en compte l’influence de la valeur manquante. – But we may be dealing with "MNAR" data (Missing Not At Random) E.g. patient's state of health 33 Analyse de sensibilité L'analyse de sensibilité est une étape essentielle dans une étude, souvent **quasi systématiquement requise**, pour tester la robustesse des conclusions face à des Sensitivity analysis hypothèses différentes. Principe :** - **Hypothèses alternatives :** - L’analyse de sensibilité repose sur la question **"et si ?"** : que se passerait-il si les hypothèses ou méthodes sous-jacentes étaient modifiées ? - Cela peut inclure des scénarios différents pour la gestion des données manquantes ou des hypothèses statistiques. Fundamental, (almost) systematically required - **Complément à l’analyse principale :** - Elle ne remplace pas l’analyse principale mais la **complète** en testant des situations hypothétiques. Résultats possibles :** Based on assumptions, what if ? 1. **Conclusions similaires entre l’analyse principale et l’ analyse de sensibilité :** - Les estimations restent proches dans les deux analyses. - Cela indique une **robustesse des conclusions**, qui ne sont pas affectées par les pertes d’informations ou par They complement the main analysis – 2 scenarios les choix méthodologiques sur les données manquantes. 2. **Conclusions différentes :** - Si les résultats changent significativement, cela met en évidence une **sensibilité élevée** de l’étude à certaines – Sensitivity and main analyses hypothèses ou méthodes. - Dans ce cas, les conclusions de l’étude doivent être interprétées avec prudence. Résumé :** Similar conclusions L’analyse de sensibilité est cruciale pour évaluer dans quelle mesure les hypothèses méthodologiques ou les choix de gestion des données manquantes influencent les Close estimates résultats. Si les conclusions sont robustes (similaires à travers différents scénarios), cela renforce leur fiabilité. Robustness of conclusions (not affected by loss of information or MD management through underlying assumptions) 34 Sensitivity analysis Sensitivity and main analyses – Give different results (even conflicting) – Different estimates Conclusions affected by loss of information and MD management (underlying assumptions) Consequences compromises the scope of the results, possibly invalidating them (discordant cases) General rule all statistical analyses (+ sensitivity) defined a priori in the protocol 35 Sensitivity analysis Some examples of sensitivity analysis strategies – Compare results obtained on Available data Compete data – MNAR missing data hypothesis Multiple imputations – "Responder analysis" MD = failure (by MD cause) 36 Analyse "worst case" – Hypothèse de biais maximal Sensitivity analysis L’analyse de type "worst case" (ou cas le plus défavorable) est une méthode utilisée pour explorer les **scénarios extrêmes** dans une étude, en supposant un **biais maximal**. Elle permet d’évaluer la robustesse des conclusions en présence de données manquantes (**MD**). Principe :** - **Hypothèse du biais maximal :** - **Pour le groupe expérimental (traité)** : Some examples of analyses toutes les données manquantes (MD) sont considérées comme des **échecs**. - **Pour le groupe témoin (non traité)** : toutes les données manquantes sont considérées comme des **succès**. – "Worst case analysis" – Maximum bias hypothesis Remarques :** MD = failure (treated experimental group) 1. **Cas caricatural :** - Cette méthode repose sur des hypothèses déterministes et extrêmes. Ce n’est pas un scénario réaliste, mais une façon de tester la MD = success (control group) résistance des conclusions de l’étude. 2. **Robustesse des conclusions :** - Si les conclusions de l’analyse "worst case" sont similaires à celles obtenues dans d’autres Remarks analyses de sensibilité et dans l’analyse principale : - Cela montre que les résultats de l’étude sont **robustes**, même dans un scénario – Caricature case (deterministic) extrêmement défavorable. – If conclusion other sensitivity analyses and main analysis Robustness ++ Résumé :** L’analyse "worst case" explore l’impact maximal des biais dus aux données manquantes en supposant des hypothèses -Point méthodologique :** - Cette approche doit être **décrite explicitement extrêmes. Elle est utile pour tester la robustesse des résultats, dans le protocole** de l’étude pour garantir la même si elle repose sur un scénario caricatural. Si les transparence et permettre une bonne conclusions restent inchangées, cela renforce la **confiance** interprétation des résultats. dans les résultats de l’étude. To be explicitly described in the protocol 37 Conclusions – Discussion MD at inclusion : simple methods → preserve randomisation MD on endpoints : focus on HYPOTHESES not methods Include all individuals in sensitivity analyses Mixed models → preferred strategies – Multiple imputations (sensitivity analyses) 38 References (1) Altman D et al (2001). The revised CONSORT statement for reporting randomized trials: Explanation and elaboration. Annals of Internal Medicine 134: 663–694. Committee for proprietary medicinal products (2001). Points to consider on missing data. http://www.emea.europa.eu/pdfs/human/ewp/177699EN.pdf European Medicines Agency (2010). Guideline on missing data in confirmatory clinical trials. http://www.ema.europa.eu/ema/pages/includes/document/ open_document.jsp?webContentId=WC500096793 Greenland S, Finkle W (1995). A critical look at methods for handling missing covariates in epidemiologic regression analyses. American Journal of Epidemiology 142: 1255–1264. Gray R et al (2006). Adherence therapy for people with schizophrenia: European multicentre randomised controlled trial. British Journal of Psychiatry 189: 508–514. Hollis S, Campbell F (1999). What is meant by intention to treat analysis? Survey of published randomised controlled trials. British Medical Journal 319: 670–4. Kenward MG, Goetghebeur EJT, Molenberghs G (2001). Sensitivity analysis for incomplete categorical tables. Statistical Modelling 1: 31–48. Mallinckrodt CH et al (2004). The effect of correlation structure on treatment contrasts estimated from incomplete clinical trial data with likelihood-based repeated measures compared with last observation carried forward ANOVA. Clinical Trials 1:477–489. 39 References (2) Moher D, Schulz KF, Altman DA, for the CONSORT group (2001). The CONSORT statement: Revised recommendations for improving the quality of reports of parallel-group randomised trials. Lancet 357:1191– 1194. National Research Council (2010). The Prevention and Treatment of Missing Data in Clinical Trials. Panel on Handling Missing Data in Clinical Trials. Committee on National Statistics, Division of Behavioral and Social Sciences and Education. http://www.nap.edu/catalog.php?record_id=12955. Sutton S, Gilbert H (2007). Effectiveness of individually tailored smoking cessation advice letters as an adjunct to telephone counselling and generic self-help materials: randomized controlled trial. Addiction 102:994–1000. Riper H et al (2008). Web-based self-help for problem drinkers: a pragmatic randomized trial. Addiction 103:218–227. White IR, Horton N, Carpenter J, Pocock SJ (2011). An intention-to-treat analysis strategy for randomised trials with missing outcome data. British Medical Journal http://www.bmj.com/content/342/bmj.d40.full.html? ijkey=08IQJ8etzBYYGLw&keytype=ref. White IR, Thompson SG (2005). Adjusting for partially missing baseline measurements in randomised trials. Statistics in Medicine 24:993–1007. White IR, Wood A, Royston P (2011). Multiple imputation using chained equations: issues and guidance for practice. Statistics in Medicine; 30: 377–399. 40