Significación estadística, relevancia clínica y escitalopram

Un ensayo clínico aleatorizado plantea un contraste de hipótesis: la hipótesis nula, es decir, que no existen diferencias entre ambos tratamientos y la hipótesis alternativa, que realmente son diferentes. Para no olvidarnos más de cuál es cuál, os sugerimos una fácil regla nemotécnica: dos fármacos son iguales mientras no se demuestre lo contrario, por lo que el diseño del estudio irá dirigido a tumbar la hipótesis nula y demostrar que la alternativa es la válida.

En una prueba de contraste de hipótesis o de significación estadística, calcularemos la probabilidad de que los resultados obtenidos sean debidos al azar en el supuesto de que la hipótesis nula sea cierta. Esta probabilidad es el grado de significación estadística o valor de p. Basándose en esta probabilidad, se decidirá rechazar o no la hipótesis nula. Cuanto menor sea el valor de p, menor será la probabilidad de que los resultados obtenidos se deban al azar y mayor evidencia habrá en contra de la hipótesis nula. Si dicha probabilidad es menor que un valor de p fijado previamente (por consensose suele tomar el valor de p<0,05) la hipótesis nula se rechazará. Así, cuando el valor de p está por debajo de 0,05, se dirá que el resultado es estadísticamente significativo y será no significativo en caso contrario.

En un ensayo clínico, además de fijarnos en la significación estadística de los resultados, es importante determinar su relevancia clínica, que está relacionada con aspectos como los siguientes:

- El estudio es pertinente e investiga aspectos importantes de una patología.

- Incluye variables de resultado relevantes, a ser posible orientadas al paciente y no a la enfermedad.

- Tiene validez interna (lo que afecta a aspectos tales como la existencia de una aleatorización, cegamiento, tamaño muestral… adecuados).

- Tiene validez externa (que se comprueba preguntándonos si nuestro paciente concreto hubiera sido aceptado o rechazado de haber participado en la fase de reclutamiento del estudio).

Además de los aspectos anteriores hay que tener en cuenta que, desde un punto de vista metodológico, hay un punto de corte (como la famosa p) a partir del cual los resultados se consideran clínicamente relevantes. Consideremos, por ejemplo el caso del escitalopram: hasta la fecha, algunos ensayos clínicos han puesto de manifiesto que existen diferencias estadísticamente significativas en términos de eficacia entre el isómero (s-citalopram) y la mezcla racémica. No obstante, ni la guía de práctica clínica del NICE ni la del ACP han dado a estas diferencias el marchamo de relevantes, desde un punto de vista clínico. O dicho de otra forma, desde la perspectiva del paciente, las diferencias entre citalopram y escitalopram actualmente se consideran irrelevantes. Vamos a intentar explicar por qué:

En primer lugar, como nos recuerda Gerald Gartlenher en la revisión sistemática publicada en Annals of Internal Medicine el año pasado (Ann Intern Med. 2008;149:734-750, pág. 737) el beneficio relativo a favor del escitalopram es, en relación al citalopram,  de 1,14 (IC95% 1,04-1,26). Si extrapolamos dicha diferencia a la escala de Montgomery-Asberg (MADRS), una de las más utilizadas en depresión, la diferencia implicaría una reducción media de 1,13 puntos (IC95% 0,18-2,09) en una escala -no lo olvidemos- cuyo rango de puntuación oscila entre 0 y 60 puntos.

De forma intuitiva, podemos concluir que la magnitud de esta diferencia es pequeña. Pero ¿qué sentido tiene dicha diferencia en el contexto del objetivo clínico del tratamiento de la depresión? Esto entronca con la segunda de las consideraciones que queremos hacer:

Algunas guías de práctica clínica (como la del ICSI), definen dicho objetivo como la mejora de los síntomas, la recuperación de la funcionalidad ocupacional y psicosocial del paciente y la prevención de recaídas. Desde esta perspectiva, en depresión, son variables de resultado mucho más interesantes las que investigan el impacto de los tratamientos sobre la remisión de la enfermedad al final del tratamiento, las recaídas y los suicidios, por poner tres ejemplos claros. No obstante lo anterior, en los ensayos clínicos con antidepresivos una medida de resultado muy utilizada consiste en determinar el porcentaje de pacientes que disminuyen la puntuación en la escala determinada en un 50% a las 4-12 semanas. Esta medida de resultado es un tanto arbitraria, pues puede pasar que un paciente consiga una reducción del 51% y otro del 49%. ¿Qué diferencias habrá entre ellos desde el punto de vista clínico? Posiblemente ninguna, pero al evaluar la eficacia del antidepresivo en cuestión, ambos quedarán englobados en grupos distintos.

La tercera consideración, no menos importante que las anteriores, es de tipo metodológico: como decíamos más arriba, está establecido que la diferencia de eficacia, para ser considerada relevante desde una perspectiva clínica debe ser igual o superior a 1/2 la desviación estándar de la medida del efecto. ¿Qué ocurre en el caso del escitalopram vs citalopram? que dicha diferencia oscila entre 1/5 y 1/4 de la desviación. Es decir, no sólo intuitivamente como hemos visto con la escala de MADRS, la diferencia entre ambos fármacos es pequeña, sino que metodológicamente también lo es.

Y terminamos. Como hemos visto, evaluar los resultados de un ensayo clínico va mucho más de ver su significación estadística. Sabemos que hay autoría fantasma, sesgos de publicación, estudios con una calidad deplorable o cuya única razón de ser es apuntalar las ventajas competitivas ideadas en los despachos de marketing. Muchas veces, hemos de aceptar pulpo como animal de compañía, en lo que a la evidencia disponible respecta. Pero al fin y a la postre ésta, es contumaz. En lo que a nuestro ejemplo respecta, no nos cabe la menor duda de que escitalopram es un fármaco, seguro y eficaz en sus indicaciones. Tanto como citalopram, a la luz de la evidencia actualmente disponible. Pero mucho más caro. Y con estas mimbres, queda irremediablemente condenado al banquillo de las alternativas terapéuticas. Una pena conformarse con ser Raúl, pudiendo ser Cristiano Ronaldo.

About these ads

14 comentarios en “Significación estadística, relevancia clínica y escitalopram

  1. Mi más sincera felicitación por prácticamente todas las entradas del blog. Fino análisis y muy útil. Es como sacar agua del mar con un vaso intentado vaciarlo, pero reconforta leerlo.
    Eso sí, Raúl ha sido el remedio de todas las enfermedades durante más de una década.
    Un saludo

  2. Felicidades Carlos por la exposición sobre las diferencias entre citalopram y escitalopram. Aprovecharé tus comentarios ante los “defensores” a ultranza de escitalopram aunque no se qué me hace sospechar que ante la comercialización de escitalopram genérico (acaban de presentármelo) esta discusión dejará de tener interés para muchos………………….

    1. Gracias, Rosa. Y feliz año.
      Si bueno… una vez que haya genéricos en el mercado, lo de la rapidez de acción (ver meta-análisis de Cipriani en la Cochrane) y demás argumentos, posiblemente acabe en el olvido. El tiempo pone a cada cual en su sitio y escitalopram -siendo tan buen antidepresivo como citalopram- se comercializó por quien se comercializó por lo que se comercializó y al precio que se comercializó. Y lo demás, me recuerda a lo de los tres pies del gato…

  3. Un cordial saludo.

    Es la primera vez que leo una de vuestras entradas (gracias a google reader por “sugerir” este blog) y os felicito.

    Soy estadístico y por esa razón me he leído el post. Muy buena explicación del contraste de hipótesis, y esa regla mnemotécnica es muy buena. A veces cuando intento explicar el C.I con la Ho, y la H1 a la gente le cuesta un poco diferenciarlas.

    Bueno, a lo que iba, es cierto, por desgracia la estadística es tan susceptible de ser “alterada” que hace que se tenga que coger casi cualquier artículo que se base en estadísticas con pinzas, y, como comentáis, a veces hay que ir un poco más allá de los resultados. También es cierto que en muchos casos NO basta con utilizar una técnica estadística solo, sino que es necesario utilizar otras tantas para acotar bien la interpretación y conclusión del estudio

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s