« Enfin(?) seul. | Page d'accueil | Saint Esprit »
06/07/2005
La non infériorité.
Ce type d’études statistiques envahit lentement mais sûrement le monde des études cliniques.
Depuis longtemps, j’avais envie d’écrire sur ce sujet, mais il me manquait une trame et des références bibliographiques. Enfin, les statistiques restent pour moi en grande partie mystérieuses.
Pourtant, encore une fois, toutes les décisions médicales actuelles et futures se basent et se baseront sur des études cliniques, elles même basées sur des concepts statistiques plus ou moins sophistiqués.
Au début, un peu comme tout le monde, j’ai fait confiance aux revues scientifiques, et aux quelques bases mathématiques enseignées en médecine pour trier le bon grain de l’ivraie.
Mais je me suis rapidement rendu compte, que c’était une erreur, et qu’il fallait développer un peu mes connaissances statistiques pour développer mon sens critique, et résister aux Chants des Sirènes (devinez à qui je pense…).
Petit rappel.
Jusqu'à peu, les trames statistiques des grandes études de qualité étaient créées pour montrer qu’un produit A était meilleur qu’un placebo, ou qu’un produit B de référence.
Bien entendu, toute étude valable doit être au mieux randomisée, en double aveugle, en plus d’être comparative. Si elle est multicentrique, on touche le Nirvana. RALES en 1999 est un bon exemple d’une bonne étude, il y en a bien d’autres.
Depuis peu donc, éclosent des études dites « d’équivalence » ou de « non infériorité ».
Pourquoi un tel développement ?
Primo, car il est plus simple de démontrer qu’un produit est non inférieur, que de prouver qu’il est supérieur en terme de statistiques. Secundo car la taille des échantillons étudiés peut être moindre, donc des coûts plus faibles. Tertio, le risque marketing est moindre, une étude « de non infériorité » positive vaut mieux qu’une étude de supériorité négative (qui signifie l’enterrement quasi systématique du produit).
Le but n’est pas de démontrer une supériorité de A sur B, mais une « non infériorité » de A par rapport à B.
Enorme nuance.
L’étude pourra donc être positive, donc favorable pour A, même si A est jugé équivalent à B.
Personnellement, je pense que c’est déjà une régression par rapport aux études de supériorité. On pourra arguer que les effets secondaires de A sont moindres que ceux de B, et donc que A est « mieux » que B, même en cas d’équivalence statistique.
Mais il faut faire une autre étude dans ce cas, et si possible de supériorité.
Donc à partir du moment ou l’étude que je lis est de ce type, j’arrête ma lecture, et je ferme la revue.
Mais développons un peu d’autres raisons qui ne font que confirmer mon attitude.
Le risque majeur est à mon avis celui d’être tenté de « tripatouiller » les données afin de rendre l’étude positive.
Les statistiques visent à étudier l’efficacité d’un produit A sur un échantillon de patients, et non sur tous.
Le simple fait de choisir un échantillon induit une marge d’erreur incompressible dans la seule mesure d’un effet (je ne parle même pas de comparaison ici).
Chaque mesure moyenne est accompagnée de sa marge d’erreur qui dépend de plusieurs facteurs (c’est « l’écart type » ou le « standard deviation » ou « SD » des anglo-saxons)
Donc, quand on compare deux effets dans un étude de non infériorité, il faut tolérer une certaine valeur en dessous de laquelle, A et B seront déclarés équivalents.
Par exemple dans SPORTIF V, qui compare deux anticoagulants, les deux produits ont été jugés équivalents jusqu’à un seuil toléré de 2% d’évènements graves évités par an.
Donc si A présente 1.9% d’évènements graves évités de moins que B, il sera quand même jugé « équivalent » à B. Vous comprenez par ailleurs, que s’il s’agit de décès ou d’évènements graves, ce fameux seuil peut devenir rapidement inacceptable. Comment tolérer une « équivalence » entre A et B si il existe tout de même 2% de décès en plus ?
De quoi dépend ce seuil ?
Le problème est là, il dépend du bon vouloir de ceux qui font les études. Pas tout à fait tout de même, il dépend de la littérature antérieure à l’essai, du moins celle que l’on veut bien avoir exhumée.
L’article dont je me suis très largement inspiré (les références sont à la fin) cite des exemples assez édifiants en….psychiatrie.
Je vois déjà Mélie et Shayalone se dresser sur leurs chaises !
En 1989-1990, deux études concluent en la « non infériorité » de la fluvoxamine vs l’imipramine (traitement de référence) dans les dépressions sévères.
Devinez quels ont été les seuils de différence d’efficacité tolérés, en dessous desquels la fluvoxamine est quand même jugée « équivalente » à l’imipramine ?
Dites un chiffre…
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43%
Et oui, même avec 43% d’efficacité en moins, la fluvoxamine est jugée « non inférieure » à l’imipramine
.
.
.
.
.
.
.
On peut donc clairement tout faire dire à un essai clinique, avec un peu de doigté….
Je ne connais pas du tout l'importance de ces revues que je ne lis bien évidemment pas: sont-elles lues, fiables, ont-elles un comité de lecture?
Quoiqu'il en soit, elles ont été publiées, et je n'imagine pas un instant que le marketing du labo fabriquant la fluvoxamine n'en ait pas fait ses choux gras.
La deuxième raison qui me choque, c’est que les personnes enrôlées dans ces essais (risquant donc des effets secondaires parfois grave) n’ont même plus la satisfaction de se dire qu’ils ont participé au progrès de la recherche.
Puisqu’au mieux, le match va se terminer en nul, le « design » de l’étude n’étant pas a priori créé pour montrer une supériorité…
Donc méfiance lorsque l’on ingurgite de la littérature, il faut toujours rester critique.
L’article dont je me suis très très largement inspiré est là.
22:30 Publié dans Prescrire en conscience | Lien permanent | Commentaires (4)
Commentaires
Bonjour, merci pour votre article.
Je souhaite revenir sur un point que je n'ai pas compris : vous déclarez que réaliser une étude de non infériorité est moins coûteux (qu'une étude de supériorité).
Or pour conclure à une non infériorité entre deux produits, il faut donc conclure à une absence de différence significative entre les deux produits. Donc afin d'avoir la meilleur puissance possible, il convient d'augmenter l'échantillon et ce d'autant plus que la différence réelle (intrinsèque) entre les deux produits est minime.
Ainsi, je comprends l'histoire d'une étude comme : 1) réalisation d'une étude comparative en intention de traité, 2) analyse des résultats, 3) Essai de transformation en étude de non infériorité (si la taille de l'échantillon le permet) et publication des résultats (parfois même en étudiant en intention de traiter alors qu'il faut étudier en analyse par protocole).
cf. http://www.grouperechercheactionsante.com/noninferiorite.htm
à bientôt.
Écrit par : Grégoire Muller | 22/10/2008
En fait, il faut définir dès le début si l'on désire faire une étude de supériorité ou une étude de non infériorité. Tout le reste du protocole, notamment le choix du nombre de patients va en dépendre.
Et c'est vrai que dans ce cas, le nombre de sujets à inclure est moindre pour les études de non infériorité.
Écrit par : lawrence | 22/10/2008
Monsieur,
je me permet de revenir sur votre article que je découvre ce jour car il comporte quelques inexactitudes.
En effet les études de non infériorités sont apparues dans les années 90 afin de répondre à la problématique suivante : je sais que mon nouveau traitement (T) ne fera jamais meiux (= trés peu probable) que la référence (R); toute fois il apporte autre chose pour la prise en charge du patient, par ex. c'est un comprimé au lieu d'une injection, il fait moins vomir, etc...
Comme faire alors pour démontrer que T peut apporter quelque chose par rapport à R?
Si je fais un essai en supériorité alors je suis sur de ne pas avoir de résultat positif, mon produit est mort et mes patients peuvent ne pas tirer avantage de la nouvelle formulation T.
Donc je mets en place un essai de non infériorité dont le but est de démontrer au mieux le fait que T est au moins aussi efficace que R dans l'inducation revendiquée (je ne fais pas perdre de chance au patient en lui donnant T plus tot que R).
Dans ce type d'essai tout repose sur la marge de non infériorité (je ne l'ai pas vue mentionnée dans votre reflextion sauf erreur de ma part). Cette marge correspond à la perte de chance que je m'autorise vis a vis de R. Cette marge n'est pas sortie d'un chapeau comme le lapin blanc mais elle fait suite à des calculs régit par des textes de l'EMEA.
S'en suit l'essai, dont l'échantillon est le plus fréquement plus important que celui neccessaire dans un essai de supériorité.
Voilà je voulais éclaircir ces points.
Écrit par : Alain | 09/11/2009
Bonsoir, merci beaucoup pour votre commentaire.
En fait, cette note est la première que j'ai écrite sur le sujet, ensuite, j'ai un peu creusé le sujet et j'espère que j'ai été un peu moins imprécis: http://grangeblanche.hautetfort.com/archive/2008/08/24/let-s-talk-about-stats-2.html
Écrit par : lawrence | 09/11/2009
Les commentaires sont fermés.