Evidence based medicine: betekenis voor de farmacotherapie


Terug naar boven

 

Het fenomeen 'evidence based medicine' (EBM) mag zich niet alleen verheugen in een toenemende belangstelling van beoefenaren van de geneeskunde, maar ook van beleidsmedewerkers van overheid en ziektekostenverzekeraars. De idee van EBM is echter niet nieuw, want een dergelijk gedachtegoed werd ook al in de vorige eeuw uitgedragen.1

Sackett, één van de grondleggers, definieert EBM als 'het nauwgezet en verstandig gebruik van het beste voorhanden bewijs, afkomstig uit systematisch patiëntgebonden wetenschappelijk onderzoek, bij het nemen van beslissingen in de zorg voor individuele patiënten'.1 Deze definitie bevat een aantal begrippen die een nadere toelichting verdienen.

EBM is een hulpmiddel bij 'het nemen van beslissingen in de zorg voor individuele patiënten'. Voorstanders van EBM gaan ervan uit dat artsen de vaardigheid bezitten om individuele problemen te kunnen omzetten in een vraag waarop een antwoord kan worden gezocht. Voorts veronderstellen zij dat de betrokken arts direct toegang weet te vinden tot actuele informatiebronnen waarin het onderzoeksbewijs wordt omschreven. Vervolgens moet de arts in staat zijn in de hooiberg van resultaten uit klinisch wetenschappelijk onderzoek de speld van het beste bewijs te vinden. Het begrip bewijs kan op verschillende manieren worden gebruikt: hier is het geen wiskundig bewijs. 'Nauwgezet' betekent, dat het gevonden klinisch bewijs wordt toegepast bij iedere patiënt voor wie dit relevant is. 'Verstandig gebruik' vereist klinische expertise waarmee de arts de voor- en nadelen van diagnostische onderzoeken en behandelingswijzen voor iedere patiënt kan afwegen. Hierbij dient men rekening te houden met het wegen van de kansen op ziekte vooraf, de eventuele aanwezigheid van comorbiditeit, en de unieke kenmerken en persoonlijke voorkeuren van de patiënt. EBM kan men beschouwen als een nuttige integratie van het bekende begrip 'rationele farmacotherapie', waaronder men meestal verstaat 'het voorschrijven van het juiste geneesmiddel aan een individuele patiënt of een populatie wanneer dat nodig is, volgens een doseringsschema dat overeenkomt met het meest geschikte profiel van effectiviteit, bijwerkingen en kosten'. Volgens EBM is het niet alleen mogelijk deze rationaliteit na te streven, maar kan men ook beschikken over een effectief instrument om die te meten en te documenteren, namelijk het gerandomiseerd klinisch onderzoek. Daarbij past echter de relativering dat de principes van rationele farmacotherapie tegenwoordig steeds meer onder druk staan. De ontwikkeling van nieuwe geneesmiddelen, promotionele activiteiten en het geneesmiddelengebruik zijn in toenemende mate afhankelijk van variabelen die niet specifiek behoren tot het domein van kennis en kunde op het gebied van de farmacologie, de therapie en de geneesmiddeleninformatie.

Aan de toepassing van EBM in de dagelijkse zorg voor patiënten zitten de nodige haken en ogen, die kunnen worden herleid tot drie hoofdvragen:

  1. methodologie: hoe is het klinisch bewijs verkregen? 
  2. interpretatie: wat is de betekenis van het klinisch bewijs? 
  3. toepassing in de praktijk: welke gevolgen heeft het klinisch bewijs volgens de opvattingen van de patiënt en de arts?    

Aan de hand van deze vragen wordt in dit artikel ingegaan op de betekenis van EBM voor de farmacotherapie. Eerder is aan diverse aspecten van de interpretatie van klinisch geneesmiddelenonderzoek aandacht besteed in Gebu 1987; 21: 73-84 en Gebu 1996; 30: 63-70.

 

 


Terug naar boven

 

Binnen de geneeskunde is een stroming ontstaan die ervan uitgaat dat alleen resultaten die afkomstig zijn uit onderzoek dat voldoet aan bepaalde methodologische criteria, daadwerkelijk mag tellen als bewijs. Bij de waardering van bewijs speelt de vraag naar het oorzakelijk verband ofwel de causaliteit een belangrijke rol. Kan uit het onderzoek worden afgeleid, dat interventie X effect Y tot gevolg had? Of is er sprake van een samenhang tussen X en Y zonder bewezen causaliteit (post of propter)?

Men rangschikt de klassen van bewijs op grond van het type onderzoek, waarbij klasse 1 als het beste bewijs geldt. Er worden diverse classificaties gehanteerd waarbij tevens onderscheid wordt gemaakt tussen diagnostisch, therapeutisch en prognostisch onderzoek. Een van de indelingen die voor therapeutisch onderzoek vaak wordt gebruikt is de volgende:

  1. systematische literatuuroverzichten en meta-analysen; 
  2. gerandomiseerd gecontroleerd klinisch onderzoek met doorslaggevende resultaten; 
  3. gerandomiseerd gecontroleerd klinisch onderzoek met resultaten die niet doorslaggevend zijn; 
  4. cohortonderzoek; 
  5. patiënt-controle-onderzoek; 
  6. dwarsdoorsnede onderzoek; 
  7. casuïstiek of de mening van deskundigen.    

De top van deze hiërarchie wordt dus ingenomen door de systematische overzichten, zoals de meta-analyse (Gebu 1995; 29: 11-16). Een systematisch literatuuroverzicht voldoet aan een aantal voorwaarden van zorgvuldigheid: een zo volledig mogelijke zoekactie naar onderzoeken, een kwaliteitsbeoordeling van de onderzoeken, en een transparante presentatie en valide synthese van de gegevens. Deze synthese kan plaatsvinden in de vorm van een meta-analyse ofwel statistische samenvoeging (‘pooling’). Een meta-analyse kan een onderdeel van een systematisch literatuuroverzicht zijn. Over de vraag wat de criteria zijn waarmee kwaliteit moet worden beoordeeld, bestaat echter geen overeenstemming. Het uitsluiten van methodologisch minder goede onderzoeken is een van de minder 'transparante' manieren om met bewijs om te gaan.3 Bij veel disciplines wordt het verzamelen en beoordelen van het klinisch bewijs verricht door werkgroepen die zich hierin hebben bekwaamd, teneinde richtlijnen, consensusteksten of standaarden te formuleren die het beleid van de individuele arts kunnen ondersteunen. De belangrijkste tekortkoming van deze procedure is de vertekening als gevolg van selectieve publicatie (publicatie-'bias'). Onderzoek heeft namelijk aangetoond dat positieve onderzoeksresultaten vaker in wetenschappelijke tijdschriften worden gepubliceerd dan negatieve. Hierdoor loopt men het gevaar een te positief beeld te krijgen van een bepaalde interventie. Een instelling, zoals de Cochrane Collaboration, tracht deze vertekening te beperken door alle, ook (nog) niet gepubliceerde onderzoeken over een bepaald onderwerp op te sporen, te rubriceren en samen te vatten in systematische literatuuroverzichten. Elk kwartaal publiceert de Cochrane Collaboration een overzicht op cd-rom van alle tot dan toe bekende klinisch onderzoeken en systematische literatuuroverzichten. Overigens is het de vraag of een meta-analyse van diverse kleine onderzoeken een groot opgezet klinisch onderzoek overbodig maakt. Hierover bestaat nog volop discussie.5-7

De experimentele onderzoeksopzet van het gerandomiseerde klinische onderzoek wordt gezien als de 'gouden standaard' om het effect van een interventie vast te stellen. Zo zijn, om een nieuw geneesmiddel geregistreerd te krijgen, in het algemeen ten minste twee gerandomiseerde, klinische onderzoeken nodig. Deze moeten, vrijwel altijd ten opzichte van placebo, een positief effect laten zien dat ook klinisch van betekenis is (Gebu 1998; 32: 66).

Een patiënt-controle-onderzoek kan belangrijke, aanvullende informatie opleveren over relatief zeldzame bijwerkingen en complicaties van behandelingen, zoals het risico van trombose bij orale anticonceptiva (Gebu 1996; 30: 22-23) of dat van een myocardinfarct bij kortwerkende calciumantagonisten (Gebu 1996; 30: 51-57). Verder kan soms om ethische redenen randomisatie ongewenst zijn, zoals bij een onderzoek naar de zorg aan terminale patiënten.8 Welke onderzoeksopzet het best haalbare bewijs oplevert, wordt dus mede bepaald door de aard van de vraagstelling.

 

 


Terug naar boven

Bij de beoordeling van het klinisch bewijs uit geneesmiddelenonderzoek dient de lezer, volgens de principes van EBM, gericht aandacht te schenken aan een aantal elementen uit het onderzoek.9 Het betreft achtereenvolgens de opzet en uitvoering van het onderzoek, en de analyse en interpretatie van de resultaten.

 


Terug naar boven

 

Vraagstelling
De vraagstelling van het onderzoek moet vooraf geformuleerd zijn in de vorm van een hypothese. Meestal is het doel van het onderzoek het toetsen van een zogenoemde nulhypothese, namelijk dat er geen verschil in effectiviteit is tussen twee behandelingen. In nogal wat klinisch onderzoek blijft het formuleren van een hypothese achterwege en construeren de onderzoekers achteraf een vraagstelling. Het risico bestaat dat men deze aanpast aan de aard van de resultaten.

Steekproefgrootte
Vooraf behoort het te verwachten resultaat, bijvoorbeeld het minimale klinisch relevante verschil tussen twee therapieën, te worden gespecificeerd. Vervolgens bepaalt men met behulp van statistische methoden de kans om een bepaald effect te ontdekken ('power'), waarna de minimaal vereiste steekproefgrootte wordt vastgesteld. Een dergelijke verantwoording van het aantal onderzochte patiënten ontbreekt vaak. Dit betekent dat bij een statistisch niet-significant resultaat niet duidelijk is of er werkelijk geen verschil bestond tussen de twee therapieën of dat het aantal patiënten te klein was om het naar voren te brengen.

Toepasbaarheid
De arts zal moeten nagaan of het klinisch bewijs wel van toepassing is op diens eigen patiënt. Daarvoor is het nodig te weten of het opgenomen dan wel eerstelijnspatiënten betrof. Voorts is onder meer van belang te weten wat de in- en exclusiecriteria waren, wat de ernst van de symptomen was en of de patiënten al eerder met geneesmiddelen waren behandeld. Uit onderzoeksoogpunt is een homogene patiëntengroep gewenst, maar dergelijke sterk geselecteerde populaties zijn vaak niet representatief voor de eigen praktijkpopulatie. Zo is veel klinisch bewijs verzameld in onderzoeken bij relatief jonge mannen die leden aan één aandoening. De huisarts heeft echter vaak te maken met oudere vrouwen die voor meerdere kwalen verschillende geneesmiddelen tegelijkertijd gebruiken.

Meetinstrumenten
Deze dienen valide, betrouwbaar en responsief te zijn, en goed omschreven. Het meetinstrument is valide wanneer het meet wat we willen weten voor de vraagstelling van het onderzoek. Voorbeelden zijn een visuele analoge schaal (VAS), waarbij de patiënt op een tienpuntsschaal de ernst van de pijnklachten kan aangeven, of de Hamilton-score voor de ernst van een depressie. Een meetinstrument is betrouwbaar wanneer de uitkomsten bij herhaling en in andere onderzoekscentra reproduceerbaar zijn. Een meetinstrument is responsief als het een klinisch relevante verbetering kan vaststellen.

 

 


Terug naar boven

 

Randomisatie
Om te voorkomen dat de resultaten van een onderzoek worden beïnvloed door oordelen of voorkeuren van patiënten en onderzoekers, vindt de toewijzing van patiënten aan één van beide behandelingsgroepen van een onderzoek aselect ofwel ‘at random’ plaats. Met dit randomiseren bereikt men meestal dat de patiënten in beide behandelingsgroepen vergelijkbaar zijn, wat bijvoorbeeld leeftijd en geslacht betreft. Daarnaast worden hiermee onbekende factoren die de prognose kunnen beïnvloeden gelijk verdeeld over beide groepen.

Om beïnvloeding door bewuste en onbewuste voorkeuren van arts en patiënt te vermijden, voert men het onderzoek dubbelblind uit. Noch de patiënt, noch de arts weet welke behandeling men krijgt. Bij een enkelblind onderzoek is hetzij de onderzoeker, hetzij de patiënt niet geblindeerd en bij een open onderzoek geen van beide.

Controlegroep
Om de plaats van een nieuw geneesmiddel te kunnen bepalen, is een vergelijking met het geneesmiddel, dat op dat moment als eerste keus wordt beschouwd, het meest informatief. Belangrijk is ook dat dit geneesmiddel in de standaarddosering is toegepast, want voor een verantwoorde interpretatie mag het niet te laag zijn gedoseerd (geringere effectiviteit), maar ook niet te hoog (meer bijwerkingen). Is een vergelijkend onderzoek met andere middelen niet mogelijk, dan is het aantonen van een statistisch significant verschil met placebo alleen voldoende, mits het verschil ook klinisch relevant is. Verder is het van belang dat patiënten in beide groepen, behoudens het geneesmiddel, dezelfde begeleidende behandelingen ondergaan.

Eindpunten
Bij de interpretatie van de onderzoeksresultaten maakt men onderscheid tussen harde eindpunten, zoals morbiditeit, mortaliteit of genezing, en zogenoemde intermediaire of surrogaateindpunten. Daarnaast kent men overigens ook maten die onder de noemer ‘kwaliteit van leven’ vallen. Een surrogaateindpunt is meestal een eenvoudig te meten uitkomst van een therapeutische interventie, maar is zelf geen directe maat voor een klinisch effect en houdt op zichzelf ook geen ziekte in.10 Door het gebruik van surrogaatparameters is het mogelijk om de belasting voor de patiënt en de grootte, de duur en dus de kosten van een klinisch onderzoek beperkt te houden. Wijzigingen in surrogaatparameters die bij de beoordeling van geneesmiddelen veel worden gemeten zijn: bloeddrukverlaging, de afname van linkerventrikelhypertrofie, verlaging van de cholesterol, de afname van de prostaat specifiek antigeen concentratie en de vermindering van de plasmavirusconcentratie.

Surrogaateindpunten hebben ook diverse nadelen. Een verandering erin beantwoordt niet de vraag naar het doel van een bepaalde behandeling bij de individuele patiënt en naar diens eigen voorkeur. Het is ook mogelijk dat het surrogaateindpunt het behandelingsdoel niet weerspiegelt en dus niet valide is. Verder wordt door het meten van een surrogaateindpunt slechts één aspect bepaald, terwijl alle andere buiten beschouwing worden gelaten. Tenslotte zijn ze vaak ontwikkeld in proefdieronderzoek, waarbij extrapolatie naar mensen niet altijd is geoorloofd.10 Een voorbeeld van een minder goed surrogaateindpunt vormt het aantal CD4+-cellen bij HIV-geïnfecteerden. Aanvankelijk werd dit beschouwd als een goede indicator voor progressie van de ziekte. Het Concorde-onderzoek liet echter zien dat de plasmavirusconcentratie een betere indicator hiervan is.

Ook de discussie over de optimale behandeling van hypertensie wordt mede bepaald door de waarde van surrogaateindpunten.11 Het doel van de therapie is immers uiteindelijk het gunstig beïnvloeden van de cardiovasculaire morbiditeit en mortaliteit. Het is daarbij de vraag of men het effect van twee verschillende antihypertensiva die een verhoogde bloeddruk in gelijke mate verlagen op dit uiteindelijke doel zonder meer gelijk mag stellen. Een voorbeeld kan dit illustreren. In het MIDAS-onderzoek bij hypertensieve patiënten bleek de calciumantagonist isradipine (2 dd 2,5-5 mg) gedurende drie jaar de verhoogde diastolische bloeddruk even sterk te verlagen als hydrochloorthiazide (2 dd 12,5-25 mg), namelijk met 13,0 mm Hg.12 Een opname in verband met angina pectoris kwam bij patiënten met isradipine, dat wordt verondersteld anti-angineuze eigenschappen te bezitten, echter bijna vier keer zo vaak voor als bij degenen met hydrochloorthiazide, hetgeen significant verschilde (RR: 3,66 [95%BI=1,03-13,02]).12 In dit onderzoek was het effect op het surrogaateindpunt dus vergelijkbaar, maar had het diureticum een beter effect op een belangrijk cardiovasculair eindpunt. Het gebruik van de bloeddruk als surrogaat voor het effect op belangrijke cardiovasculaire uitkomsten hoeft dus niet altijd juist te zijn. Geneesmiddelen oefenen nu eenmaal doorgaans veelvoudige effecten uit.

 

 


Terug naar boven

 

Statistische toetsen
Onderzoekers dienen vooraf in het onderzoeksprotocol aan te geven wat de primaire, en eventueel secundaire eindpunten van het onderzoek zijn. Ook moet de wijze waarop de statistische analyse van de resultaten plaatsvindt, zijn aangegeven. Meestal zal men met de gangbare methoden uitkomen. Ook dient te worden vermeld of er subgroepanalysen zullen plaatsvinden en zo ja, welke. Alleen die conclusies die de globale effecten op de primaire eindpunten beschrijven, zijn als valide te beschouwen, omdat de onderzoeksopzet immers daarop was gericht. Scepsis is op zijn plaats als significante resultaten worden verkregen met weinig gangbare statistische methoden of als subgroepanalysen worden verricht die niet in het protocol waren beschreven.

Uitval
De resultaten worden bij voorkeur geanalyseerd volgens het principe van 'intention to treat'. Dit betekent dat men de uitkomsten analyseert overeenkomstig de aan het begin van het onderzoek toegewezen behandeling. Belangrijk is dat van alle gerandomiseerde patiënten de uitkomsten zijn terug te vinden of dat wordt verantwoord om welke reden sommigen de behandeling hebben gestaakt. Was dat vanwege gebrek aan effectiviteit, het optreden van bijwerkingen of om een andere reden? Het wekt weinig vertrouwen als de gegevens van een substantieel aantal patiënten niet zijn terug te vinden. Dit geldt des te meer indien de ontbrekende patiëntengegevens ongelijk over beide groepen zijn verdeeld. Een andere wijze van analyseren van de resultaten is de ‘per protocolanalyse’. Hierbij worden alleen patiënten in de analyse betrokken die daadwerkelijk de toegewezen behandeling volledig hebben afgemaakt. Dat de resultaten daarvan meestal beter uitvallen dan bij een ‘intention to treat’-analyse spreekt voor zich.

 

 


Terug naar boven

 

Statistische significantie
Van een statistisch significant resultaat wordt gesproken als bij de toetsing van de resultaten de nulhypothese wordt verworpen. Uitgangspunt van de toetsing is dat men niet weet naar welke kant de resultaten zullen wijzen: positief of negatief voor de interventie. Daarom toetst men tweezijdig. Bij uitsluitend eenzijdige toetsing is wantrouwen op zijn plaats. Het resultaat wordt uitgedrukt in een zogenoemde p-waarde. Op arbitraire gronden heeft men in het verleden bepaald dat een p-waarde die gelijk aan of kleiner is dan 0,05 statistisch significant heet. Als bijvoorbeeld bij de toetsing van de resultaten van een onderzoek een p<0,01 wordt vermeld, dan betekent dit dat de kans op deze resultaten, als de nul-hypothese toch waar zou zijn (dus als er geen verschil tussen beide behandelingen bestaat), kleiner is dan 1 op 100. Soms spreekt men wel van 'een tendens naar significantie', 'bijna significant' of 'in hoge mate significant'. Dat zijn misleidende begrippen, omdat volgens de definitie de nulhypothese alleen kan worden aangenomen of verworpen, zodat een resultaat alleen significant of niet-significant kan zijn.

Het belangrijkste nadeel van het enkel gebruiken van het begrip significantie is dat een p-waarde niets zegt over de grootte van een effect.

Betrouwbaarheidsinterval
Om de precisie van de resultaten weer te geven, geeft men deze vaak weer met een betrouwbaarheidsinterval (BI). In de praktijk gebruikt men meestal het 95%BI: naast de puntschatting van het effect geeft men het interval aan waarbinnen met 95% zekerheid de werkelijke waarde ligt. De algemene regel luidt dat het betrouwbaarheidsinterval de neutrale waarde, namelijk geen verschil tussen interventie en controle, dient uit te sluiten. Deze neutrale waarde bedraagt bijvoorbeeld 1 bij het relatieve risico en 0 bij het risicoverschil. Het BI biedt meer informatie over de grootte van het gevonden effect, omdat het tevens de spreiding weergeeft. Een groot aantal patiënten leidt per definitie tot een smaller BI dan een klein aantal en zal dus vaker tot significantie leiden.

Bijwerkingen
Deze dienen nauwgezet te worden vermeld, hetgeen overigens vaak niet gebeurt. Een statistische toetsing van eventuele verschillen in bijwerkingen tussen twee geneesmiddelen is noodzakelijk om te kunnen bepalen of de balans tussen effectiviteit en bijwerkingen voor het ene middel beter uitvalt dan voor het andere. De aantallen patiënten die men, mede op economische gronden, in een onderzoek kan opnemen, zijn echter nooit voldoende om kleine positieve effecten of zeldzame, maar soms ernstige bijwerkingen aan het licht te brengen. Ook sommige interacties en contra-indicaties komen pas bij gebruik op ruimere schaal naar voren. Bij het 'post-marketing surveillance'- ofwel fase 4-onderzoek registreert men met name de bijwerkingen, nadat een middel op de markt is verschenen en onder praktijkomstandigheden wordt toegepast. De gevolgen van chronisch of verkeerd gebruik blijken soms zelfs pas na vele jaren.

Het 'Number Needed to Treat'
Om een beter inzicht te verkrijgen in de betekenis voor de praktijk, worden onderzoeksresultaten steeds vaker uitgedrukt in het 'Number Needed to Treat' (NNT). Overigens kan men ook hierbij weer een betrouwbaarheidsinterval bepalen. Het NNT geeft het aantal patiënten weer dat men moet behandelen om ten opzichte van de therapie waarmee men vergelijkt (bv. placebo) bij één extra patiënt een gunstige uitkomst te verkrijgen of een ongunstige te voorkomen. Dit aantal is het omgekeerde van de absolute reductie van het risico (ARR) door een actieve behandeling ten opzichte van een behandeling waarmee men vergelijkt (NNT=1/ARR).

Het is nietszeggend, zoals nogal eens in promotioneel materiaal gebeurt, om alleen de relatieve risicovermindering te vermelden. Zo stelt een firma dat een, via recombinanttechniek gefabriceerd hormoon de kans op vruchtbaarheid met 25% verhoogt ten opzichte van hetzelfde, conventioneel geproduceerde hormoon. In feite betreft het echter een toename van de absolute kans met 5% (van 20,4 naar 25,7%). Het zal duidelijk zijn dat een relatief behandelingseffect van 50% bij een risicovermindering van 40 naar 20% een ander gevolg voor de praktijk behoort te hebben dan een afname van 4 naar 2%. De uitkomst krijgt dus pas betekenis wanneer tevens de absolute risicovermindering of het NNT wordt gegeven. Het NNT is voorts afhankelijk van de patiëntenpopulatie in het onderzoek: om de onderzoeksresultaten te vertalen naar de praktijk zal het risicoprofiel van een individuele patiënt hiermee in verband moeten worden gebracht.13

Het NNT wordt ook wel toegepast om de frequentie van bijwerkingen uit te drukken, maar het is dan beter te spreken over het 'Number Needed to Harm' (NNH). Dit is het aantal patiënten waarbij men tijdens een actieve behandeling bij één extra persoon een bijwerking zou induceren ten opzichte van een controlebehandeling. Zo bleek in de 'Physician's Health Study' de frequentie van een ulcus duodeni bij asymptomatische personen die als primaire preventie acetylsalicylzuur kregen, ten opzichte van placebo na zestig maanden significant te zijn toegenomen van 0,2% naar 0,4%.14 Dit betekent dat, wanneer 500 patiënten met acetylsalicylzuur worden behandeld, men kan verwachten dat één patiënt extra een ulcus duodeni krijgt. De balans van de behandeling was echter positief: aan de winstzijde stond namelijk een preventie van vijf myocardinfarcten.

Klinische relevantie
Het vermelden van onderzoeksresultaten in relatieve in plaats van absolute termen, blijkt te leiden tot een veel grotere geneigdheid tot voorschrijven. Huisartsen die bijvoorbeeld werden geïnformeerd dat gemfibrozil leidde tot een relatieve vermindering van het risico van een cardiovasculair voorval met 34% zeiden in 77% van de gevallen bereid te zijn het middel voor te schrijven (Gebu 1994; 28: 76). Indien hetzelfde resultaat echter werd gepresenteerd als een absolute vermindering (met 1,4%), dan was slechts 24% van hen daartoe geneigd.

Uiteindelijk blijft de beoordeling om al dan niet te behandelen een beslissing met een subjectief element, waarbij de omstandigheden van de individuele patiënt in twijfelgevallen de doorslag zullen geven. In tabel 1 worden enkele richtlijnen gegeven om de klinische relevantie van uitkomsten te bepalen.15

 

 


Terug naar boven

  1. Beoordeel de vergelijkbaarheid tussen het individu en de onderzochte populatie. Zijn zij vergelijkbaar wat de belangrijkste prognostische factoren betreft? 
  2. Zoek zowel in de behandelings- als de controlegroep het percentage patiënten waarmee een gunstige uitkomst werd bereikt, zoals het verdwijnen van een bepaalde klacht of de verlaging van de mortaliteit 
  3. Het verschil tussen deze twee percentages is de absolute risicoreductie (ARR) 
  4. Het 'Number Needed to Treat' (NNT) is 1/ARR 
  5. Bereken analoog hieraan het extra te verwachten percentage bijwerkingen in de behandelingsgroep en bereken hieruit het 'Number Needed to Harm' (NNH
  6. Interpreteer hoe de balans uitvalt tussen effectiviteit (NNT) en bijwerkingen (NNH) en hoe deze zich verhoudt tot die van vergelijkbare geneesmiddelen bij dezelfde indicatie (Gebu 1996; 30: 63-70).  

Normen en waarden van arts en patiënt spelen een zeer belangrijke rol in het geneeskundig handelen. In wezen bevat iedere medische beslissing een waardeoordeel, ook al zijn patiënt en arts zich daarvan zelden bewust.17 18 Reeds bij het beoordelen van het klinisch bewijs is dit het geval. Het ontbreken ervan zal bij sommigen de drang oproepen tot maximaal handelen, terwijl anderen juist zullen kiezen voor een terughoudend beleid ('in dubio abstine'). Of een onderzoeksvraagstelling relevant wordt geacht, hangt ook van het waardeoordeel van de lezer af. Diens normen en waarden bepalen de betekenis die aan het klinisch bewijs wordt toegekend, met name hoe klinisch relevant het resultaat wordt geacht. In nog sterkere mate geldt dit, als de arts het klinisch bewijs toepast of extrapoleert naar de situatie van de individuele patiënt die tegenover hem of haar zit. Vaak spelen persoonlijke ervaringen van de arts daarbij een rol, zoals ziekte en sterfte in de familie- of vriendenkring en de eigen praktijk. Bij het nemen van medische beslissingen is niet zozeer het klinisch bewijs bepalend als wel de opinie van de arts daarover. Wil men de mening van de arts kunnen wegen, dan is het van belang te weten dat diens kennis is samengesteld uit persoonlijke ervaringen, (gepubliceerde) ervaringen van collega's en voorkennis omtrent de individuele kenmerken van de patiënt.19 Het is daarom voor richtlijnontwikkeling en individuele behandelbeslissingen belangrijk dat deze waarden zo expliciet mogelijk worden gemaakt. Het volgende voorbeeld toont dat het klinisch bewijs over boezemfibrilleren en het risico van een herseninfarct niet zonder meer het beleid bepalen.

 

 


Terug naar boven

 

Mevrouw Van A. is 77 jaar en een zeer vitale dame. Zij bezoekt het spreekuur van haar huisarts met klachten over hartkloppingen; deze vindt een onregelmatige pols. Mw. Van A. blijkt boezemfibrilleren te hebben en wordt verwezen naar de cardioloog. Na uitsluiting van behandelbare oorzaken en vergeefse pogingen tot cardioversie, wordt besloten het boezemfibrilleren te accepteren. Uit de vakliteratuur blijkt dat patiënten, zoals mw. Van A., een risico van 18% hebben een CVA te krijgen. Door hen met cumarinen te behandelen, wordt het risico van een beroerte verlaagd naar 6%. Na uitleg aan mw. Van A. wordt zij ingesteld op cumarinen. Enige maanden later blijkt echter, dat de stollingstijd sterk wisselt. Nu eens moet zij meer cumarinen gebruiken, dan komt er weer een spoedboodschap van de trombosedienst, dat mw. Van A. direct vitamine K moet hebben ter correctie van een te sterk verlengde stollingstijd. Een duidelijke reden hiervoor is niet te vinden. Mw. Van A. neemt haar geneesmiddelen correct in en gebruikt geen comedicatie. Zij heeft immers een uitgesproken afkeer van 'pillen'. Wel wordt duidelijk dat de kwaliteit van leven door mw. Van A. ernstig verminderd wordt geacht. Al die wisselingen in dosering met frequente controles maken haar nerveus. Herhaaldelijk heeft zij de huisarts al gevraagd, of dat 'doorschieten' echt geen kwaad kan. Haar gezondheid is een geheel andere plaats in haar leven gaan innemen dan zij gewend was en wenselijk acht. 'Dokter, zonder die pillen van u ben ik 77 jaar geworden. Sinds ik ermee ben begonnen is mijn leven heel anders geworden: ik ben mijn vrijheid kwijt, ik wil er echt mee stoppen'. Mw. Van A. heeft de antistolling gestaakt, ook de compromissuggestie van de huisarts 'dan maar dagelijks een kinderaspirientje te nemen' wees zij resoluut van de hand. Zij heeft naar de indruk van haar huisarts plezierig geleefd tot haar 84e, toen zij inderdaad werd getroffen door een beroerte en twee maanden later overleed in een verpleeghuis.

Als de arts het klinisch bewijs naar beste vermogen aan de patiënt heeft uitgelegd, kan deze zelf een oordeel vormen over de relevantie van het bewijs. Bij de toepassing van EBM dreigt het gevaar, dat de arts aan de vraag van de patiënt voorbij gaat. Er is een klinisch probleem, voor de oplossing waarvan een duidelijk bewijs bestaat, zodat men ertoe neigt onverkort volgens het klinisch bewijs te handelen. Aldus worden de voorkeuren van de patiënt buiten beschouwing gelaten, terwijl die van de hulpverlener, veelal niet geëxpliciteerd, wel een rol spelen.

Vele onderzoekers hebben gekozen voor 'objectieve' uitkomstmaten, waarmee artsen gewend zijn te werken, zoals mortaliteit en morbiditeit, of biomedische surrogaatparameters, zoals bloeddruk en cholesterolgehalte. De patiënt denkt eerder aan de kwaliteit van het dagelijks leven en aan de gevolgen voor de dagelijkse activiteiten.20 De relevantie van de uitkomsten staat dus niet op voorhand vast, maar kan door de individuele patiënt zeer verschillend worden gewaardeerd. Dit blijkt uit het voorbeeld van mevrouw Van A.21 Helaas is al een grote groep patiënten zo gemedicaliseerd dat ze hun gezondheid alleen nog in termen van bloeddruk- of cholesterolwaarden willen uitdrukken.

Systematiek van de toepassing in de praktijk
De toepassing van EBM in de praktijk begint bij de klinische expertise van de arts. Deze blijkt uit de zorgvuldige anamnese en uitvoering van gericht lichamelijk en aanvullend onderzoek, alsmede uit het nauwgezet luisteren en rekening houden met de voorkeuren, de rechten en de situatie van de patiënt.

Stapsgewijs kan het proces met behulp van de volgende vragen worden beschreven:

  1. wat is het probleem van de patiënt, wat is diens vraag daarbij en wat is het doel? 
  2. is er klinisch bewijs dat van toepassing is in deze situatie en wat is de kwaliteit daarvan? 
  3. wat is het oordeel van de patiënt over de voorgestelde interventie en het effect daarvan? 
  4. welke gezamenlijke keuze maken patiënt en arts?    

De eerste stap lijkt een open deur, maar in de praktijk gebeurt het maar al te vaak, dat de arts zelf invult waarvoor de patiënt komt zonder expliciet na te vragen of dit klopt. Naarmate meer klinisch bewijs beschikbaar komt, dreigt het doel waarvoor de patiënt komt te verdwijnen achter de bewezen beschikbare behandelingen voor de gevonden aandoening. De vraag wat het probleem is, moet echter centraal blijven staan, met andere woorden: waar komt de patiënt voor ofwel wat is de hulpvraag? Vervolgens dient men het behandelingsdoel, namelijk welk effect wordt bij de patiënt beoogd, te expliciteren. Volgens sommigen zou 'explicit medicine' dan ook een beter benaming zijn dan ‘evidence based medicine’.22

Bij de tweede stap wordt de arts ondersteund door een groot aantal standaarden, richtlijnen, consensusteksten en artikelen in bijvoorbeeld het Geneesmiddelenbulletin, die beroepsgenoten hebben samengesteld. Op geleide van de wens van de patiënt en gelet op de situatie van de gezondheidszorg kan een standaard onverkort worden gevolgd, worden aangepast of soms zelfs verworpen.23  Daarbij dient de arts voor ogen te houden, dat 'consensusteksten' weliswaar elementen van klinisch bewijs bevatten, maar voor een belangrijk deel slechts een afspraak tussen beroepsgenoten betreffen. In geval dergelijk 'voorwerk' niet is verricht, zal de arts zelf op zoek moeten gaan naar het klinisch bewijs en dit vervolgens kritisch tegen het licht moeten houden.

Door de explosieve toename van gepubliceerde medische kennis raken handboeken eerder gedateerd en verschuift de aandacht in snel tempo naar tijdschriften en vooral naar elektronische media, die bibliografische databestanden op floppydisk, cd-rom of Internet bevatten.1 Tegen lage kosten is het mogelijk meteen toegang te verkrijgen tot goed geïndexeerde bestanden, waarmee men voor elk klinisch probleem via trefwoorden kan zoeken naar overzichtsartikelen, meta-analysen en gerandomiseerde klinische onderzoeken. Belangrijke bronnen zijn de Cochrane Bibliotheek24, Medline25 en elektronische EBM-tijdschriften,26 zoals Bandolier.27

De belangrijkste vraag die men zich bij de interpretatie van deze bronnen steeds behoort te stellen, luidt: 'Is mijn patiënt vergelijkbaar met die uit de klinische onderzoeken, waarin het klinisch bewijs is vergaard?' Helaas zal dit niet altijd het geval zijn.28  De resultaten van gerandomiseerd klinisch onderzoek hebben betrekking op probabilistische verbanden en groepsgemiddelden, waarbij extrapolatie naar de individuele patiënt niet altijd zonder meer is geoorloofd.29

Als derde stap behoort de arts inzicht te geven in de systematiek van het medisch redeneren en zich te verantwoorden voor de argumentatie die heeft geleid tot diens advies of uitspraak. Vervolgens krijgt de patiënt de ruimte om een mening over de voorgestelde aanpak te formuleren. Soms zal hier een zekere 'bedenktijd' moeten worden ingelast. Voor patiënten zijn dit soort beslissingen vaak complex en de voorlichting dient dan ook met schriftelijk materiaal te worden ondersteund.

Het individualiseren van klinisch bewijs en vervolgens samen met de patiënt een keuze maken, stap vier, is bij uitstek de taak van de werkers in de gezondheidszorg.

 

 

 

Samenvatting en conclusie
Onder 'evidence based medicine' wordt verstaan het nauwgezet en verstandig gebruik van het beste voorhanden bewijs, afkomstig uit systematisch klinisch wetenschappelijk onderzoek, bij het nemen van beslissingen in de zorg voor individuele patiënten. Daarbij wordt het gerandomiseerde gecontroleerde onderzoek gezien als de 'gouden standaard' om het effect van een interventie vast te stellen. Bij de interpretatie daarvan dient men bedacht te zijn op diverse valkuilen. Zo krijgt een bepaalde uitkomst pas betekenis voor de praktijk wanneer de absolute risicovermindering en het 'Number Needed to Treat' worden bepaald, zodat de klinische relevantie kan worden vastgesteld.

Toch is de vraag naar het klinisch bewijs en of dit van toepassing is op de situatie in de eigen spreekkamer slechts een onderdeel van het totale hulpverleningsproces. Er aan vooraf gaat de vraag wat precies het probleem van de patiënt is. Voor het te volgen beleid is immers ook diens oordeel over de voorgestelde interventie en het te verwachten effect van belang, zodat arts en patiënt gezamenlijk een keuze kunnen maken.

 


Stofnaam                                            Merknaam®

acetylsalicylzuur merkloos, div. fabr., Alka-Seltzer, Aspirine, Aspro, Rhonal
gemfibrozil merkloos, div. fabr., Lopid
hydrochloorthiazide merkloos, div. fabr., Esidrex
isradipine Lomir

 


  1. Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Evidence-based medicine, how to practice and teach EBM. New York: Churchill Livingstone, 1997. 
  2. Guyatt GH, Sackett DL, Sinclair JC, Hayward R, Cook DJ, Cook RJ et al. User's guide to the medical literature. IX. A method for grading health care recommendations. JAMA 1995; 274: 1800-1804. 
  3. Detsky AS, Naylor CD, O'Rourke K, McGeer AJ, L'Abbé KA. Incorporating variations in the quality of individual randomized trials into meta-analysis. J Clin Epidemiol 1992; 45: 255-265. 
  4. Kleijnen J, Vet HCW de, Rinkel GJE, Keirse MJNC. De Cochrane Collaboration; systematische overzichten van kennis uit gerandomiseerd onderzoek. Ned Tijdschr Geneeskd 1995; 139: 1478-1482. 
  5. LeLorier J, Gregoire G, Benhaddad A. Lapierre J, Derderian F. Discrepancies between meta-analyses and subsequent large randomized, controlled trials. N Engl J Med 1997; 337: 536-542. 
  6. Ioannides JP, Cappelleri JC, Lau J. Issues in comparisons between meta-analyses and large trials. JAMA 1998; 279: 1089-1093. 
  7. Naylor CD. Meta-analysis and the meta-epidemiology of clinical research. BMJ 1997; 315: 617-619. 
  8. Lumley J, Bastian H. Competing or complementary: ethical considerations and the quality of randomised trials. Int J Health Technol Assess 1996; 12: 1247-1263. 
  9. Crombie IK. Appraising clinical trials. In: Crombie IK (ed.). The pocket guide to critical appraisal. Londen: BMJ Publishing Group, 1996: 43-49. 
  10. Greenhalgh T. Papers that report drug trials. In: Greenhalgh T (ed.). How to read a paper, the basics of evidence based medicine. Londen: BMJ Publishing Group, 1997: 87-96. Tevens: BMJ 1997; 315: 480-483. 
  11. Psaty BM, Siscovick DS, Weiss NS, Koepsell TD, Rosendaal FR, Lin D et al. Hypertension and outcomes research, from clinical trials to clinical epidemiology. Am J Hypertens 1996; 9: 178-183. 
  12. Borhani NO, Mercuri M, Borhani PA, Buckalew VM, Canossa-Terris M, Carr AA et al. Final outcome results of the Multicenter Isradipine Diuretic Atherosclerosis Study (MIDAS). JAMA 1996; 276: 785-791. 
  13. Glasziou PP, Irwig LM. An evidence based approach to individualising treatment. BMJ 1995; 311: 1356-1359. 
  14. Steering committee of the physician's health study research group. Final report on the aspirin component of the ongoing physician's health study. N Engl J Med 1989; 321: 129-135. 
  15. Davidson RA. Does it work or not? Clinical vs statistical significance. Chest 1994; 106: 932-934. 
  16. Haynes RB, Sackett DL, Gray JMA, Cook DJ, Guyatt GH. Transferring evidence from research into practice: 1. The role of clinical care research evidence in clinical decisions. ACP Journal Club 1996; 125 (3): A14-A15. 
  17. Dupuis HM. Op het scherp van de snede, goed en kwaad in de geneeskunde. Amsterdam: Uitgeverij Balans, 1998. 
  18. Thomas S. Transparante geneeskunde [oratie]. Rotterdam: Erasmus Universiteit, 1998. 
  19. Coumou HCH. Ervaringen uit een 'second opinion'-praktijk. Stelselmatige ondersteuning van patiënten bij het nemen van weloverwogen beslissingen over medische interventies. Huisarts Wet 1998; 41: 372-374. 
  20. Rothert M, Rovner D, Holmes M, Schmitt N, Talarczyk G, Kroll J et al. Women's use of information regarding hormone replacement therapy. Res Nurs Health 1990; 13: 355-366. 
  21. Diamond GA, Denton TA. Alternative perspectives on the biased foundations of medical technology assessment. Ann Int Med 1993; 118: 455-464. 
  22. Rosser WW. Application of evidence from randomised controlled trials to general practice. Lancet 1999; 353: 661-664. 
  23. Cook DJ, Greengold NL, Gray Ellrodt A, Weingarten SL. The relation between systematic reviews and practice guidelines. Ann Int Med 1997; 127: 210-216. 
  24. The Cochrane Collaboration. The Cochrane Library on CD-ROM. Oxford: Update Software Ltd, 1999, updated quarterly. ISSN 1464-780X. 
  25. National Library of Medicine. Pubmed, Medline. 
  26. ScHARR. Netting the evidence, a ScHARR introduction to evidence based practice on the Internet. 
  27. Bandolier, evidence-based health care. 
  28. Dans AL, Dans LF, Guyatt GH. Users guides to the medical literature. XIV. How to decide on the applicability of clinical trial results to your patient. JAMA 1998; 279: 545-549. 
  29. Wiersma Tj. Twee eeuwen zoeken naar medische bewijsvoering; de gespannen verhouding tussen experimentele fysiologie en klinische epidemiologie [proefschrift]. Amsterdam: Uitgeverij Boom/Belvedère, 1999. 

Aanbevolen literatuur

  • Crombie IK. The pocket guide to critical appraisal: a handbook for health care professionals. London: BMJ Publishing Group, 1996. ISBN 0-7279-1099-X. 
  • Greenhalgh T. How to read a paper; the basics of evidence based medicine. London: BMJ Publishing Group, 1997. ISBN 0-7279-1139-2. 
  • Muir Gray JA. Evidence-based healthcare; how to make health policy and management decisions. New York: Churchill Livingstone. 1997. ISBN 0-443-05721-4. 
  • Rosser WW, Shafir MS. Evidence-based family medicine. Hamilton: B.C. Decker Inc., 1998. ISBN 1-55009-053-4. 
  • Sackett DL, Richardson WS, Rosenberg W, Haynes RB. Evidence-based medicine; how to practice and teach EBM. New York: Churchill Livingstone, 1997. ISBN 0-443-05686-2. 
  • Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Clinical epidemiology: a basic science for clinical medicine. Boston: Little, Brown and Company, 1991. ISBN 0-316-76599-6. 
  • Tijssen JGP. Klinische epidemiologie. Beoordeling van onderzoek naar de effecten van therapie. Amsterdam: Amsterdam University Press, 1996. ISBN 90-5356-122-6.

Auteurs

  • dr J. Schuling, drs W.G.M. Toenders