Nieuwe aanvullende criteria voor de aannemelijkheid van subgroepanalysen

In subgroepanalysen van gerandomiseerd onderzoek of in meta-analysen daarvan wordt onderzocht of de effecten van een behandeling niet uniform zijn, maar verschillen tussen patiënten met verschillende karakteristieken. Subgroepanalysen worden vaak verricht, kunnen leiden tot nieuwe inzichten   en kunnen belangrijke implicaties hebben voor de praktijk. Het komt echter nogal eens voor dat de claims die aan subgroepanalysen worden ontleend, later in gerandomiseerd onderzoek onjuist blijken te zijn.1 
In 1992 hebben Canadese onderzoekers zeven criteria opgesteld waarmee kan worden vastgesteld of ogenschijnlijke verschillen in subgroepanalysen reëel zijn.2 Deze zijn in het onderstaande kader weergegeven.

Criteria voor het bepalen of ogenschijnlijke verschillen in subgroepanalysen reëel zijn.2
1. Is de grootte van het verschil klinisch relevant?
2. Was het verschil statistisch significant?
3. Werd de hypothese voor de analyse opgesteld of erna?
4. Was de subgroepanalyse één van een klein aantal onderzochte hypothesen?
5. Was het verschil afkomstig van vergelijkingen binnen onderzoeken of tussen onderzoeken?
6. Was het verschil consistent aanwezig in de onderzoeken?
7. Is er indirect bewijs dat het ogenschijnlijke verschil ondersteunt?

Deze criteria zijn sindsdien internationaal op grote schaal toegepast. Dezelfde Canadese onderzoeksgroep heeft recent vier aanvullende criteria opgesteld om de geloofwaardigheid van subgroepanalysen nader te specificeren.3 Aanleiding daarvoor was dat zij met de bestaande criteria onvoldoende in staat bleek om subgroepanalysen van bepaalde gerandomiseerde onderzoeken te beoordelen.

8. Is de subgroepvariabele gemeten als uitgangswaarde of pas na randomisatie? Indien de variabele is gemeten nadat de randomisatie heeft plaatsgevonden dan bestaat het gevaar dat de subgroepen die hiermee zijn gecreëerd, zijn beïnvloed door de onderzochte interventie. Het verschil kan dan volledig worden toegeschreven aan het effect van de interventie of aan een verschil in prognostische factoren in plaats van aan de subgroepvariabele.

9. Was de richting van het subgroepeffect vooraf gespecificeerd? Een werkelijk bestaand subgroepeffect wordt aannemelijker als het effect consistent aanwezig is in dezelfde richting als vooraf was gespecificeerd.

10. Is het significante subgroepeffect onafhankelijk? Bij de analyse van subgroephypothesen dient men te onderzoeken of de verschillen in effect ook door het toeval kunnen worden verklaard. Hiervoor wordt een interactietoets verricht, waarbij interactie duidt op een verschillend effect in subgroepcategorieën. De nulhypothese van een dergelijke toets voor interactie is dat het onderliggende werkelijke effect niet verschilt tussen subgroepcategorieën. Indien er sprake is van een statistisch significante interactie (regel: wees zeer sceptisch bij p>0,1, overweeg het bij een p-waarde tussen 0,01 en 0,1 en neem het serieus bij een p≤0,001), wordt de subgroephypothese geloofwaardiger.

11. Is de interactie consistent aanwezig in sterk gerelateerde uitkomsten in het onderzoek? Als de interactie reëel is, dan mag worden verwacht dat deze aantoonbaar is in alle nauw verwante uitkomsten.

Plaatsbepaling

Subgroepanalysen kunnen belangrijke hypothesen genereren of verwerpen, maar dienen aan elementaire eisen te voldoen om geloofwaardig te zijn. Bij gebruik van een grenswaarde van 0,05 voor statistische significantie, zal één op de 20 subgroepanalysen een significant resultaat laten zien (kanskapitalisatie) en zijn derhalve striktere criteria wenselijk om subgroepanalysen op hun waarde te beoordelen. De vier toegevoegde criteria kunnen daarbij helpen. Het belang van de afzonderlijke criteria loopt uiteen en het relatieve gewicht dat aan de criteria moet worden toegekend, is vooralsnog onzeker. Hopelijk kunnen deze aanvullende criteria in de toekomst nog nader worden geëvalueerd.
Het is van belang dat de lezer van artikelen zich realiseert waarom subgroepanalysen worden verricht: is dit om een effect voor de praktijk aan te tonen, of zelfs een registratie voor een indicatie binnen de subgroep te verkrijgen, of voor een etiologisch of mechanistisch inzicht? Voor vraagstellingen omtrent klinische toepassing en registratie van geneesmiddelen zijn de genoemde ja/nee-beslissingen nodig. Voor basale wetenschappelijke vragen dienen geen criteria voor de waarheidsbeleving te worden aangelegd en zijn al deze regels van weinig waarde.
Het is ten slotte van belang of de subgroepen worden ingedeeld op grond van expositiefactoren of uitkomstvariabelen. In het eerste geval onderzoekt men bijvoorbeeld of middel X anders werkt bij mannen of vrouwen. In het tweede geval onderzoekt men in plaats van uitkomst Y (bv. cardiale uitkomstmaten), een subuitkomst (niet-fatale cardiale uitkomstmaten). Het laatste is aanzienlijk vatbaarder voor manipulatie en vertekening dan het eerste, hetgeen des te meer geldt voor samengestelde eindpunten.


1. Guyatt G, et al. When to believe a subgroupanalysis. In: Guyatt G, et al. (eds.). User’s guide to the medical literature: a manual for evidence-based clinical practice. Chicago: AMA, 2008: 571-583.
2. Oxman AD, et al. A consumer’s guide to subgroup analyses. Ann Intern Med 1992; 116: 78-84.
3. Sun X, et al. Is a subgroup effect believable? Updating criteria to evaluate the credibility of subgroup analyses. BMJ 2010; 340: c117.

Auteurs

  • dr D. Bijl