Evaluación de Ensayos Clínicos (2) PDF

Document Details

GratifiedMotif

Uploaded by GratifiedMotif

Universidad de Extremadura

Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas

Tags

Intervalos de confianza Farmacología Clínica Ensayos clínicos Medicina

Summary

This document discusses the evaluation of clinical trials, specifically focusing on confidence intervals. It provides examples of calculating and interpreting confidence intervals in relation to clinical studies. The text also includes sections on the relationship of clinical samples to population parameters, with real-world examples using averages and proportions within clinical trials.

Full Transcript

FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego,...

FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas TEMA 10 EVALUACIÓN DE ENSAYOS CLÍNICOS (2) 10.1. INTERVALOS DE CONFIANZA El intervalo de confianza del promedio muestral pì de una muestra mi (tomada aleatoriamente de una urna con la población total) contine el promedio poblacional P de esa población total. Supongamos que la población española de pacientes con fibrilación auricular no valvular que toman anticoagulantes es de 350.000 personas. A nosotros lo que nos interesa es la tasa de accidentes cerebrovasculares (ACV) que tiene en un año dicha población. Si estuviera en nuestra mano, seguiríamos a esas 350.000 personas durante un año para registrar la incidencia de ACV en ese período. Imaginemos que registramos 5.250 ACV. Entonces, el promedio poblacional P resultaría 5.250/350.000 = 1,5% en un año. Este P es el riesgo absoluto o incidencia basal. No tiene error estándar. Su valor es del 1,5% y nos da toda la información con esa única cantidad. Podríamos afirmar que en la población española con fibrilación auricular el promedio poblacional de ACV es 1,5% en un año, al cual también podemos referirnos como verdadero valor del parámetro. No obstante, en la práctica, no podemos tomar a los 350.000 pacientes, sino que, basándonos en el Teorema del Límite Central (Lyapunov, 1901), vamos a utilizar una muestra aleatoria m1 con 6.022 pacientes de entre los 350.000. A partir de esta m1 buscaremos el promedio poblacional P de la población española con fibrilación auricular, que es lo que nos interesa. Si m1 es verdaderamente una muestra aleatoria tomada de la población española, podremos acercarnos al conocimiento de P. Para ello, realizaremos un seguimiento de un año a los 6.022 pacientes. Al final del año registramos 97 ACV. El promedio muestral p1 será 97/6.022 = 1,61%. Pero no es p1 lo que estamos buscando, sino P. Como suponemos que m1 es una muestra aleatoriamente tomada de la población española, su promedio muestral puede completarse con los intervalos de confianza al 95%*, de modo que p1 = 1,61% (IC 95%, 1,29% a 1,93%). OJO! Tienen la misma probabilidad, NO hay más probabilidad de estar más cerca de 1,6%. PREGUNTA DE EXAMEN! El significado práctico de todo esto es que, si repetimos la extracción de la muestra 100 veces en las mismas condiciones, es probable que en 95 de ellas el promedio poblacional P se encuentre entre 1,29% y 1,93%. Podemos decir que tenemos una confianza del 95% de que se encontrará entre dichos valores, de la misma manera que tenemos una confianza del 2,5% de que será menor del 1,29% y una confianza del 2,5% de que será mayor del 1,93%. * Los intervalos de confianza sólo tienen sentido cuando se refieren a muestras obtenidas de la población, pero no con respecto a la población total. 10.1.1. EJEMPLO REAL: ESTUDIO RELY Los investigadores tomaron una muestra aleatoria m1 de 6.022 pacientes representativos de la población mundial de pacientes con fibrilación auricular no valvular, y, tras un año, registraron 94 ACV. El promedio muestral fue p1 = 94/6.022 = 1,56% (IC 95%, 1,25% a 1,87%). 1 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas * Pruebas paramétricas: desde las muestras son capaces de inferir el valor del parámetro. Pruebas no paramétricas: no tienen esa capacidad. Las medias y los porcentajes son medidas paramétricas. IMPORTANTE. Con esta muestra, los investigadores van buscando el promedio poblacional P de toda la población mundial de pacientes con fibrilación auricular no valvular, y pueden afirmar con un nivel de confianza del 95% que P se encuentra entre 1,25% y 1,87%. Puede estar con la misma probabilidad en cualquiera de los valores del intervalo de confianza (1,25%, 1,26%, …, 1,86%, 1,87%). Por tanto, no debe interpretarse que la estimación puntual 1,56% está más cerca de P que todos los demás valores del intervalo de confianza. Si los investigadores toman de la población 100 muestras aleatorias de 6.022 sujetos para realizar cien veces el experimento, lo más probable es que el promedio poblacional P que van buscando se encuentre entre los 95 intervalos de confianza que corresponden a 95 promedios muestrales, mientras que en los 5 experimentos restantes no. En cualquier caso, se acepta como válido el hecho de acertar en 95 de cada 100 veces. Aunque existen excepciones, este 95% es el mínimo nivel de confianza que se asume en la metodología de la investigación clínica (porque se está dispuesto a aceptar un 5% de error como máximo). Sin embargo, en muchas ocasiones es necesario asumir un máximo de un 1% de error, lo cual es lo mismo que decir que se está dispuesto a un nivel de confianza mínimo del 99%. 2 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas 10.1.2. OTROS EJEMPLOS Cien intervalos de confianza de promedios muestrales corroboran el Teorema del Límite Central. -Representación de 100 intervalos de confianza al 95% calculados en 100 muestras distintas obtenidas de la misma población. La proporción poblacional era de 0,21 (línea horizontal de referencia). Se aprecia que existen 5 muestras en las que los intervalos de confianza no incluyen al verdadero parámetro poblacional (0,21). -De una población N = 2696 sujetos se calculó la media poblacional, que resultó ser µ= 114 mmHg. A continuación, de esa población se tomaron 100 muestras de n = 500 sujetos cada una, obteniendo 100 medias muestrales con sus respectivos IC 95%. De las 100 muestras, 95 contenían en su IC la media poblacional (114), mientras que 5 de ellas no la contenían. Aunque suele ser IC: 95%, no siempre es así. Muchas veces se empieza con IC: 65, 80... 3 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas 10.1.3. CÓMO SE CALCULA EL INTERVALO DE CONFIANZA DE UNA MUESTRA ALEATORIA El intervalo de confianza al 95% de una proporción (pi) es igual a la proporción ± Z multiplicado por el error estándar* de la proporción. Calculamos el intervalo de confianza al 95% de los 94 eventos que incidieron en la muestra aleatoria (m1) de 6022 pacientes representativos de la población mundial de individuos con fibrilación auricular no valvular. La proporción p1 = 94/6022 = 0,0156 (1,56%). Por lo tanto, 1 - p1 = 0,9844. En las tablas encontramos que para el nivel de confianza del 95% la Z = 1,96. IC 95% = p1 ± 1,96 x Raíz [p1 x (1 - p1) / n1] = 0,0156 ± 1,96 x Raíz [0,0156 x 0,9844 / 6022] = 0,0031 = (0,31%). De esta forma se aplica a derecha e izquierda de la proporción, obteniendo el límite inferior (1,56% - 0,31% = 1,25%) y el límite superior (1,56% + 0,31% = 1,87%). Lo expresaremos como 1,56% (IC 95%, 1,25% a 1,87%). De cada 100 veces que repitamos el experimento, tenemos la confianza de que en 95 de ellos el promedio de la población que perseguimos se encontrará entre 1,25% y 1,87%. De manera similar, previo cálculo del error estándar de la Ratio de Proporciones (RR) y del error estándar de la Diferencia de Proporciones (RAR), se calculan los intervalos de confianza del RR y de la RAR respectivamente. Y los intervalos de confianza del NNT son los inversos de los intervalos de confianza de la RAR. Cálculo por incidencias acumuladas de RR, RAR, NNT con sus IC 95%, potencia estadística y valor de p Aquí e Escribimos sobre el (o inte amarillo pálido el Nº total de muestra de cada grupo y el nº de eventos de cada grupo, y los resultados salen automáticamente… Aquí se obtiene el Riesgo absoluto Aquí se ob del grupo de intervención, RA(i) Aquí se obtiene el RR Aquí la RAR contraste ( Aquí el NNT. estadística Y aquí el Riesgo absoluto del grupo control, RA(c). Aquí IC 95% Aquí elegimos el nivel (o intervalo) de Valor de p para % Intervención % Control (Fact (IC 95%) Potencia la diferencia (Fact Box) Box) (13 a 41) 96,17% 0,000 8,30% 13,50% Aquí se obtiene la potencia de Aquí obtenemos la hoja de estadística) resultante Aquí el valor de p para la Importante recordar que siempre tocamos a sujetos corpóreos (no sé muy bien que quiere decir con esto) 4 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas Para un nivel de confianza, por ejemplo, del 95%, la diferencia entre dos grupos no es estadísticamente significativa cuando concurre alguna de las siguientes circunstancias:  Se solapan los intervalos de confianza al 95% del %RAi y %RAc  El intervalo de confianza al 95% del RR atraviesa el 1  El intervalo de confianza al 95% de la RAR atraviesa el 0  El intervalo de confianza al 95% del NNT atraviesa el infinito Como ya se ha comentado, cuando el intervalo de confianza del RR atraviesa el 1 se dice que no se ha encontrado una diferencia estadísticamente significativa entre el numerador ((%RAi) y el denominador (%RAc), lo cual quiere decir que no puede descartarse que el numerador y el denominador pertenezcan a un mismo grupo y, aunque no sean exactamente iguales, sus diferencias son compatibles con las diferencias que existen en dos muestras aleatorias de un mismo grupo. De la misma manera, cuando el intervalo de confianza de la RAR atraviesa el 0, se dice que no se ha encontrado una diferencia estadísticamente significativa entre el minuendo (%RAc) y el sustraendo (%RAi), lo cual quiere decir que no puede descartarse que el minuendo y el sustraendo pertenezcan a un mismo grupo y que, aunque no sean exactamente iguales, sus diferencias son compatibles con las diferencias que hay en dos muestras aleatorias de un mismo grupo. *El error estándar o error de muestreo es un error aleatorio que vendría a estimar la variabilidad esperable por el proceso de muestreo. El error estándar es a la muestra (dentro de una distribución de 100 muestras) lo que la desviación estándar es al individuo (dentro de una distribución de 100 individuos). 10.1.3.1. Representación gráfica del RR (riesgo relativo) En la siguiente figura simulamos un ensayo clínico en el que se comparan los infartos de los fármacos A, B, C y D (intervención) frente a placebo (control). Representamos los RR con sus intervalos de confianza al 95% de los cuatro fármacos de intervención frente al control (placebo), para lo cual el control se sitúa en el 1. 5 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas -Se encuentra un beneficio del fármaco A frente a placebo que es estadísticamente significativo: Al comparar el porcentaje de infartos con el fármaco A frente a placebo se obtuvo un RR de 0,65 (0,52 - 0,81), cuyo intervalo de confianza no atraviesa el 1. Decimos, por tato, que existe diferencia estadísticamente significativa a favor del fármaco A, ya que presenta menos porcentaje de infartos en todo su intervalo de confianza que el placebo. -No se encuentra diferencia estadísticamente significativa entre los fármacos B y C frente al placebo: Al comparar el porcentaje de infartos con el fármaco B frente a placebo se obtuvo un RR de 0,90 (0,74 - 1,10), que sí atraviesa el 1. Decimos entonces que no existe diferencia estadísticamente significativa entre ambos, ya que el fármaco B presenta menor, igual y mayor porcentaje de infartos dentro de su intervalo de confianza que el placebo. Efectivamente, este intervalo de confianza es compatible al mismo tiempo con: a) Menos porcentaje de infartos en la parte del intervalo que va desde 0,74 hasta 1 b) Igual porcentaje de infartos justo en el 1 c) Mayor porcentaje de infartos en la parte que va desde 1 hasta 1,10. Esto mismo sucede con el fármaco C frente al placebo, con un RR de 1,10 (0,91 - 1,31). -Se encuentra un riesgo añadido del fármaco D frente al placebo que es estadísticamente significativo: Al comparar el porcentaje de infartos con el fármaco D frente al placebo se obtuvo un RR de 1,32 (1,11 - 1,58), cuyo intervalo de confianza no atraviesa el 1. Por ello, decimos que existe diferencia estadísticamente significativa en contra del fármaco D, ya que presenta mayor porcentaje de infartos en todo su intervalo de confianza que el placebo. 10.1.3.2. Representación gráfica de la RAR (reducción absoluta del riesgo) Simulamos el mismo ejemplo anterior y representamos las RAR con sus intervalos de confianza al 95% de los cuatro fármacos de intervención frente al control (placebo), para lo cual el control se sitúa en el 0. 6 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas -Se encuentra un beneficio estadísticamente significativo del fármaco A frente al placebo: A comparar el porcentaje de infartos con el fármaco A frente al placebo se obtuvo una RAR de 1,06% (0,5% - 1,62%), cuyo intervalo de confianza no atraviesa el 0. Decimos, por tanto, que existe diferencia estadísticamente significativa a favor del fármaco A, ya que presenta menor porcentaje de infartos en todo su intervalo de confianza que el placebo. -No se encuentra diferencia estadísticamente significativa entre los Fármacos B y C frente a Placebo. Al comparar el porcentaje de infartos con el fármaco B frente al placebo se obtuvo una RAR de 0,31% (-0,32% - 0,94%), que sí atraviesa el 0. Decimos entonces que no existe diferencia estadísticamente significativa entre ambos, ya que el fármaco B presenta menor, igual y mayor porcentaje de infartos dentro de su intervalo de confianza que el placebo. Efectivamente, este intervalo de confianza es compatible al mismo tiempo con: a) Mayor porcentaje de infartos en la parte del intervalo que va desde -0,32% hasta el 0% b) Igual porcentaje de infartos justo en el 0% c) Menor porcentaje de infartos en la parte que va desde el 0% hasta el 0,94%. Esto mismo sucede con el fármaco C frente al placebo, con una RAR de -0,24% (-0,87% - 0,39%). -Se encuentra un daño añadido estadísticamente significativo del fármaco D frente al placebo: Al comparar el porcentaje de infartos con el fármaco D frente al placebo se obtuvo una RAR -1,01% (-1,67% a -0,34%), cuyo intervalo de confianza no atraviesa el 1. Por ello, decimos que existe diferencia estadísticamente significativa en contra del fármaco D, ya que presenta mayor porcentaje de infartos en todo su intervalo de confianza que el placebo. Y como todo su intervalo de confianza es negativo, nos resultará más fácil comprenderlo cambiando el signo negativo a positivo, pasando a denominarse Aumento Absoluto del Riesgo (AAR) = 1,01% (0,34% - 1,67%). 10.1.3.3. Representación gráfica del NNT (número necesario a tratar) Representamos los NNT con sus intervalos de confianza al 95% de los cuatro fármacos de intervención frente al control (placebo), calculando los inversos de las RAR anteriores, para lo cual el control se sitúa en el 0. Figura 4: Representación gráfica del Número Necesario a Tratar para evitar"un" evento. NNT = 1 / RAR La diferencia no es estadísticamente significativa cuando al IC del NNT "atraviesa el NNT 94 (62 a 200) Fármaco A infinito" NNT 323 (106 a -313) Fármaco B Fármaco C NNT -417 (-115 a 256) 0 El fármaco de intervención daña El fármaco de intervención beneficia más más que el control que el control 7 FARMACOLOGÍA CLÍNICA Mª Mar Carreño, Alejandro Cabanillas, Bárbara Fernández, Gonzalo Borrego, Rocío Galeano, Cristina Cangas -Se encuentra un beneficio estadísticamente significativo del fármaco A frente al placebo: Al comparar el porcentaje de infartos con el fármaco A frente al placebo se obtuvo una NNT de 94 (62 - 200), cuyo intervalo de confianza no atraviesa el infinito. Decimos, por tanto, que existe diferencia estadísticamente significativa a favor del fármaco A, ya que es necesario tratar entre 62 y 200 pacientes para evitar un infarto. -No se encuentra diferencia estadísticamente significativa entre los fármacos B y C frente al placebo: Al comparar el porcentaje de infartos con el fármaco B frente al placebo se obtuvo un NNT de 323 (106 a -313), que sí atraviesa el infinito. Decimos entonces que no existe diferencia estadísticamente significativa entre ambos, porque es compatible con evitar un infarto más que con el placebo si tratamos entre 106 e infinitos pacientes, y con producir un infarto más que con el placebo por cada 313 e infinitos pacientes tratados. Lo mismo sucede con el fármaco C frente al placebo, con un NNT de -417 (256 a -115). -Se encuentra un daño añadido estadísticamente significativo del fármaco D frente al placebo: Al comparar el porcentaje de infartos con el fármaco D frente al placebo se obtuvo un NNT de -99 (-60 a -294), cuyo intervalo de confianza no atraviesa el infinito. Por ello, decimos que existe diferencia estadísticamente significativa en contra del fármaco D, porque produce un infarto más que el placebo si tratamos entre 60 y 294 pacientes. Y como todo su intervalo de confianza es negativo, nos resultará más fácil comprenderlo cambiando el signo negativo a positivo, pasando a denominarse Número Necesario para Dañar a un paciente más que con Placebo (NND) =99 (60 - 294). 8

Use Quizgecko on...
Browser
Browser