dinsdag 6 maart 2012

Waarom kankerscreening zo ongezond is

Waarom kankerscreening ongezond is

Het idee om kanker door voortijdige opsporing te bestrijden dateert van nazi-Duitsland. Duitsland was leidinggevend in de wetenschap en volksgezondheid. Voor het eigen ras wilden de nazi’s het beste, als gezonde productieve mens-machine. De Ariër had de plicht om gezond te zijn; de man als strijder voor volk en vaderland, de vrouw als baarmoeder om nieuwe baarmoeders en strijders te leveren. Tijdens de oorlog ontstonden de eerste ideeën om ‘na de oorlog’ met mobiele radiografietoestellen het Rijk af te reizen en alle vrouwenborsten geregeld door te stralen. Proctor stelt in zijn indrukwekkende The nazi war on cancer dat op de dag dat operatie Barbarossa begon, de inval van Duitsland in de Sovjet-Unie, het tweede punt op Hitlers regeringsagenda een discussie over borstkankerscreening betrof.
Het idee van geregelde screening werd gepromoot in het Derde Rijk met de terminologie die gebruikt werd voor de beschrijving van de oplossing van hun minderheidsproblemen – gezondheidspromotie verbond kanker typisch met karikaturen van zigeuners. De nazi-ideologie was minder anti-semitisch dan universeel racistisch: de zigeuners deelden het tragische lot van de joden in nazi-Duitsland. Kankercellen werden afgebeeld als zigeuners, nomadische volksvreemde cellen die nergens thuishoorden maar zich bandeloos voortplantten en zo het lichaam ten gronde richtten. Kanker en zigeuners moesten worden opgespoord en vernietigd om het lichaam en het volk gezond te houden. Typisch voor het oude en het nieuwe moderne gezondheidsfascisme is het idee dat kanker een externe dreiging vormt, die kan worden afgeweerd door uitroeiing van de schuldigen.
In dit hoofdstuk neem ik borstkankerscreening met mammografie als voorbeeld, maar de principes zijn geldig voor alle vormen van kankerscreening. Hopelijk lezen ook de hoogleraren van de Nederlandse en Belgische universiteiten deze tekst. Ik heb de indruk dat de meest elementaire kennis van de screeningsepidemiologie een gesloten boek is voor hen, wat zich overigens zelden vertaalt in enige bescheidenheid terzake. Bent u vrouw, verslind dit hoofdstuk en laat u niet langer ringeloren door een tekort aan informatie over borstkankerscreening. Kennis is macht: beheer die kennis.

Waarom kankerscreening vaak foute resultaten oplevert: drie ijzeren wetten
De ijzeren wet van Bayes: grote aantallen vals positieven
Bayes was een Presbyteriaanse dominee en wiskundige uit de achttiende eeuw. De wet van Bayes vormt het fundament van de moderne statistiek, klinische epidemiologie en medische besliskunde. Samengevat verklaart ze dat de kans dat een test ‘waar positief‘ is, afhankelijk is van de kans dat iemand ‘echt waar positief‘ is en van de testkwaliteit. Diagnostische testen zijn onvolmaakt, zeker mammografieën. De testkwaliteit wordt uitgedrukt als sensitiviteit en specificiteit. De sensitiviteit of gevoeligheid is de kans om een onware diagnose ook als onwaar te herkennen. In de praktijk betekent een gevoelige test dat je een negatieve test mag betrouwen: je mist zelden een ware diagnose. De specificiteit is de kans om een ware diagnose ook als waar te bestempelen. In de praktijk betekent een specifieke test dat je een positieve test mag betrouwen. Je zal zelden een onware (“vals positieve”) diagnose stellen. Bij onvolmaakte testen gebaseerd op interpretatie zoals een mammografie, liggen specificiteit en sensitiviteit steeds in de balans. Het ene gaat ten koste van het andere. Als je gevoelig bent, ga je zelden een borstkanker missen ten koste van veel vals positieve testen. Als je specifiek bent, ga je weinig testen ten onrechte als positief aanduiden, ten koste van veel gemiste diagnosen. In de kadertekst vindt u toepassingen van de wet van Bayes.
Omdat gezonde vrouwen niet vaak kanker hebben, zijn de testen vaak vals positief. Die testen kost geld, maar leiden ook tot angst bij de vrouw, die bang moet afwachten of ze nu ook echt kanker heeft. Hoe defensiever de geneeskunde (i.e. hoe meer er getest wordt), hoe meer vals positieve testen. In Nederland en België wordt verwacht dat ongeveer 1% van de vrouwen tussen de 50 en 75 jaar aantoonbare borstkanker hebben. In Nederland worden dan 2-3% van de vrouwen doorverwezen voor verder onderzoek, in Vlaanderen 6% en in Wallonië meer dan 10%. In de communautaire discussies over de splitsing van de gezondheidszorg wordt vaak verwezen naar de “andere cultuur” in Wallonië. In dit geval is het beter het beestje te benoemen voor wat het is: defensieve en dure geneeskunde ten koste van de patiënt en ten voordele van de screeningindustrie.
Zwart of wit in mammografie is gemakkelijk, maar er is veel grijs. Waar de radioloog in dit grijs de grens legt tussen zwart of wit hangt niet af van zijn kennis of wetenschappelijke vorming, maar van de mate van zijn belangen. Belangenverstrengeling met de behandelende chirurg en vrees voor juridische vervolging voor het missen van een bestaande kanker zijn krachtige prikkels om grijs tot zwart te verklaren. Doorgaans is de belangenverstrengeling met behandelaars groot, omdat de radioloog leeft van door anderen aangevraagde onderzoeken. Dat is de belangrijkste reden om screening toch te laten organiseren door een ambtelijke (staats-)organisatie, los van de belanghebbende medische industrie. Hieruit mag overigens enkel worden afgeleid dat artsen gewone mensen zijn die reageren op economische en sociale prikkels. In toestanden van onzekerheid is er geen goed of fout, enkel probabilistische waarschijnlijkheid.

De ijzeren wet van Darwin: grote aantallen ‘valse’ kankers
Kanker is een evolutionair proces. Een terminale kanker had wat nodig was om je te doden. Op zijn lange weg naar kwaadaardigheid is het een wolf geworden. Een vroeg gezwel, gedetecteerd bij screening, heeft nog een lange weg te gaan. Sommigen worden wolven, anderen blijven schoothondjes. Dat is een weg van vallen en opstaan: veel vroeg ontdekte borstkankers hebben niet de vereiste karakteristieken om door te groeien. Sommigen zullen die verwerven, andere niet. Dat is een geheel onvoorspelbaar toevalsproces.
Het ontdekken van ‘valse‘ kanker heet pseudodiagnose. Hoe vroeger kankers ontdekt worden, hoe kleiner ze zijn, hoe meer pseudodiagnose er optreedt. Het zou eerlijker zijn om bij screening ontdekte borstkanker geen kanker te noemen, maar een risico op kanker. De toekomstige evolutie is immers onbekend. Eerlijkheid is echter wel het laatste dat je mag verwachten van de screeningindustrie, die wordt gedomineerd door economische belangen.

De ijzeren wet van snelheid en traagheid
Kanker komt voor in grote spreidingen van groeisnelheid en metastasebereidheid. Sommige groeien traag en zaaien laat uit. Ik noem ze hondjes. Anderen groeien snel en zaaien graag en snel uit. Ik noem ze wolven. Veronderstel een bevolking waar kankers zijn samengesteld uit de helft hondjes en de helft wolven. De wolven doden allen, de hondjes doden niemand. Als je deze bevolking geregeld preventief onderzoekt, ga je gemakkelijk alle hondjes vinden. Die groeien traag, zijn lang aanwezig en worden bijna zeker gevonden. De wolven worden allemaal gemist: die zijn al uitgezaaid. Een mammografie vindt een gezwel van een halve centimeter: dit zijn miljarden cellen waarvan de voorouders jaren aanwezig waren. De sterfte in de gescreende bevolking is dan nul, de overleving 100%. Vroegtijdige opsporing lijkt een fantastisch succes: bijna niemand sterft nog na een kanker gedetecteerd door screening. Maar eigenlijk werd geen enkel leven gespaard. De sterfte bij de wolven blijft onveranderd; je hebt enkel de hondjes vroeger gevonden. Dit is natuurlijk heel simplistisch. Maar verdeel de wolven in boosaardige en minder boosaardige, de hondjes in brave en minder brave. Als je dat dikwijls genoeg doet, en je zet alles op een rij, heb je een distributie. Die begint met heel goedaardige hondjes, die langzamerhand kwaadaardiger wordt tot je eindigt bij de meest boosaardige wolven.
Screening zal steeds een overmaat aan hondjes vinden, en een overmaat aan wolven missen. Hondjes blijven immers netjes zitten, wolven zaaien snel uit. Een andere term voor wolven is ook wel intervalkanker, een kanker die zich ontwikkelt tussen twee screeningronden in. Bij de eerste screening is de kanker er niet, bij de volgende screening is het al te laat.
            Omdat je veel hondjes vindt, sterven weinig vrouwen met screenkanker aan borstkanker. Dat heet vertekening door duurtijd, length time bias in het Engels. Hoe langer kanker aanwezig is, hoe meer kans je hebt om die op te sporen, hoe meer kans dat deze kanker minder kwaadaardig van karakter is, hoe beter de prognose.
            Omdat je de diagnose vroeger stelt, leven de vrouwen steeds langer met borstkanker. Dat heet vertekening door vervroeging, of lead time bias. Als je in Mechelen instapt, leef je een twintig minuten in de intercity naar Brussel; als je in Antwerpen instapt, is dat drie kwartier: je overleving in de trein is verdubbeld. Je komt wel op hetzelfde moment aan in Brussel, maar je bent enkel vroeger op de trein gestapt.

Door deze vertekeningen lijkt borstkankerscreeing de prognose van borstkanker fantastisch te hebben verbeterd. Maar er kunnen net evenveel vrouwen als voordien aan borstkanker overlijden. Wat er is gebeurd, is enkel dat gezonde vrouwen het etiket borstkanker werd opgeplakt, en goedaardige kanker het etiket kwaadaardig. Screening heeft enkel gezonde jaren in de bevolking omgezet in jaren met de diagnose borstkanker: vrouwen die vroeger nooit wisten dat ze kankercellen in hun lichaam meedroegen (en daar ook nooit last van hadden), zijn nu borstkankerpatiënt.

Voorbeeldje

Toepassingen van de wet van Bayes
1 – Een vijftigjarige vrouw voelt een verdacht knobbeltje in haar borst en gaat naar de huisarts. Die vindt dat knobbeltje ook verdacht en stuurt haar door voor een (klinische) mammografie. De kans dat deze vrouw ook echt kanker heeft, is ongeveer één kans op vijf, of twintig procent. De testspecificiteit is 95%: de kans dat een vrouw die geen kanker heeft, ook een normale mammografie heeft. De testsensitiviteit is 99%: de kans dat een vrouw die wel kanker heeft, ook een normale mammografie heeft. De tabel beschrijft de resultaten twee bij twee van een mammografie bij tienduizend denkbeeldige vrouwen met een verdacht knobbeltje.



Ziek
niet ziek
Predictieve waarde
mammo plus
1980
400
83%
mammo min
20
7600
0,3%

2000
8000


<bijschrift tabel> Vrouw met 20% kans op kanker

20% van de vrouwen met een knobbeltje heeft naar waarheid kanker (2000 op 10.000). De testsensitiviteit is 1980 op 2000, de testspecificiteit is 7600 op 8000. Als de mammografie negatief is, is de kans redelijk klein dat ze toch kanker heeft. Als de mammografie positief is, is de kans groter dan 80% dat ze ook echt kanker heeft. Diagnostische testen zijn meer betrouwbaar bij iemand met tekenen of symptomen van een ziekte.

2 – Een vijftigjarige vrouw laat zich screenen. Deze vrouw heeft geen klachten, voelt geen knobbeltje, en heeft anderszins geen hoog risico op kanker. De kans dat deze vrouw dan kanker heeft, is ongeveer 1% of 1 kans op honderd. De testkwaliteiten blijven onveranderd.



Ziek
niet ziek
Predictieve waarde
mammo plus
99
400
20%
mammo min
1
9500
0,01%

100
9900


<bijschrift tabel> Gezonde vrouw met 1% kans op borstkanker, de uitgevoerde screeningsmammografie heeft 95% specificiteit en 99% sensitiviteit.

1% is ziek (100 op 10000). 99% van deze 100 heeft ook een ‘positieve‘ mammografie. 9900 zijn niet ziek. 95% (afgerond 9500) heeft een ‘negatieve‘ mammografie. Van de vijfhonderd voor mogelijke borstkanker verwezen vrouwen heeft slechts een op de vijf borstkanker. Dat komt dicht bij schattingen voor Belgie. Voor dokters is dit wenselijk. De kans dat ze wat missen is niet zo hoog, en ze verdienen goed aan verdere diagnostiek van de vijf die geen kanker hebben.

3- Vals positieve testen zijn duur en vervelend. De vrouw wordt doodsangst op het lijf gejaagd. Er moet een stukje uit haar borst worden genomen (een biopsie) om de kankerdiagnose te bevestigen of ontkrachten. We kunnen dan de mammografielezing scherper maken en minder snel de diagnose ‘kanker‘ stellen. Maar bij dezelfde test gaat toenemende specificiteit steeds gepaard met afnemende sensitiviteit. De verdeling van zwart, wit en grijs verandert niet in de mammografie; enkel de hoeveelheid grijs die zwart of wit wordt verklaard. Als meer grijs tot wit wordt verklaart, verklaar je er minder tot zwart. In plaats van 99% sensitief en 95% specificiteit lezen we de mammografie nu met 95% sensitiviteit en 99% specificiteit.



ziek
Niet ziek
Predictieve waarde
mammo plus
95
100
49%
mammo min
5
9800
0,05%

100
9900
10000

<bijschrift tabel> Gezonde vrouw met 1% kans op borstkanker, de uitgevoerde screeningsmammografie heeft 99% specificiteit en 95% sensitiviteit.

1% is nog ziek, dat is niet veranderd. Nu worden er wel vijf vindbare kankers gemist. Van de positieve mammografieën heeft nu de helft kanker. Voor de staat is dit wenselijker: ze besparen aanzienlijk op de bijkomende diagnostiek. Dit is vergelijkbaar met de Nederlandse situatie. Maar de screeningsradiologen komen onder druk: er worden vijf kankers gemist. Dat zijn potentieel heel kwade klanten: die gaan achter hun radioloog aan. Als ze het zelf niet overleven, dan gaat hun familie wel achter ze aan. Wee de radioloog die, die donkerder grijs toch wit heeft verklaard. Daarom neigen de aantallen vals positieve testen steeds maar toe te nemen, ook in Nederland. De onvermijdelijke intervalkankers zijn het mes in de rug van iedere screeningsradioloog.


De noodzaak van gerandomiseerd onderzoek
Doet borstkankerscreening de sterfte aan borstkanker nu dalen of niet? De enige manier om dat echt te weten te komen is een groot onderzoek dat grote groepen vrouwen toevallig onderverdeelt in een groep die systematisch wordt gescreend, en een groep die routinezorg krijgt. Omdat borstkanker een redelijk zeldzame doodsoorzaak blijft, heb je voor dit soort onderzoek enorme aantallen nodig. Vooral in Zweden werd er veel screeningsonderzoek gedaan, en de resultaten waren opmerkelijk divers. Hoe ‘beter‘ het onderzoek gevoerd werd (volgens internationaal aanvaarde protocols), hoe minder effect screening leek te hebben. Maar wegens de enorme belangen, ook in de wetenschappelijke wereld, werden de ‘goede’ onderzoeken met ‘slechte’ resultaten zelden geciteerd, in tegenstelling tot de ‘slechte’ onderzoeken met ‘goede’ resultaten. Het bleek geen toeval dat deze laatste onderzoeken gevoerd werden door gedreven artsen die diep geloofden in de baten van screening.
Tot 2000 was dit min of meer de consensus: borstkankerscreening was effectief, zij het enkel aangetoond in minder goede studies. Deze consensus kreeg een enorme dreun toen de Deen Gotzche, een onafhankelijke onderzoeker van de Cochrane-samenwerking, zich tegen de gegevens begon aan te schurken.

 
Gerandomiseerd onderzoek in de praktijk
Hoe werkt gerandomiseerd onderzoek? Het probleem is dat vergelijkingen in het gewone leven steeds imperfect zijn: de ene bevolking is nooit geheel gelijk aan de andere. Het juiste effect van passief roken kan niet worden afgeleid uit het vergelijken van niet-rokende partners van rokers met niet-rokende partners van niet-rokers, omdat deze groepen niet identiek zijn. In de geneeskunde is dat probleem nog veel groter dan elders: oppassende mensen die graag en veel gezondheidszorg consumeren, leven langer en gezonder dan mensen wier gezondheid hen minder kan schelen. Een straf voorbeeld waren vrouwen die in gecontroleerd gerandomiseerd onderzoek placebo’s namen. Placebo’s zijn neppillen, zodat niemand (behalve achteraf de onderzoeker) weet wie wel en wie niet een pil nam. Via bepaalde potjes waar je iedere keer maar één pil uit kon nemen kon worden nagegaan of mensen ook hun pillen namen. Daardoor konden niet alleen mensen worden vergeleken die hun pillen wel of niet namen, maar ook vrouwen die hun neppillen wel of niet namen. De sterfte van de vrouwen die dagelijks braaf hun neppil hadden genomen was bijna de helft lager dan van de vrouwen die hun neppillen erg onregelmatig of niet hadden genomen. Als je slikkers van neppillen vergelijkt met niet-slikkers, zou de neppil fantastisch goed voor de gezondheid zijn.
Veronderstel een pil die goed is tegen hartinfarcten (statines zijn een goed voorbeeld). Bij gerandomiseerd gecontroleerd onderzoek wordt de bevolking onderverdeeld door het lot. Bevolking A, de interventiegroep, krijgt de pil; bevolking B, de controlepil, krijgt de neppil. Als het onderzoek dubbel blind is, weet noch de arts noch de deelnemer wie een echte en wie een neppil krijgt. Vervolgens ga je ijverig hartinfarcten tellen. Op het einde van het onderzoek breken de onderzoekers de code en weten wie een echte pil kreeg, en wie een neppil. Als de echte pil heeft gewerkt, heeft de bevolking die enkel neppillen aangeboden kreeg meer infarcten gehad.
Als het onderzoek goed wordt uitgevoerd, is de conclusie waterdicht: mensen die pil A hadden aangeboden gekregen kregen minder infarcten dan mensen die de neppil kregen. Als het toeval goed heeft gewerkt, zijn beide bevolkingen identiek aan elkaar: het enige verschil is pil A of neppil. Pil A heeft dus gewerkt. Je kan niet zeggen hoe goed pil A werkt, maar je kan wel zeggen hoe goed het aanbieden van pil A heeft gewerkt. Dat is prima, want zo is het echte leven. Pil A zou heel goed kunnen werken, maar misschien veel vervelende bijwerkingen hebben. Als pil A heel goed werkt in theorie, maar niemand blijft ze nemen, werkt ze niet in praktijk. Dat is de kernvraag die Evidence Based Medicine (EBM) zich stelt: werkt het aanbieden van pil of interventie in de praktijk? In theorie doodt bleekwater virussen; in de praktijk schrijf je geen bleekwater voor wegens de bijwerkingen. Op basis van het vorige onderzoek kan de huisarts nu met gerust gemoed pil A voorschrijven, als hij het risico op een (herhaald) infarct wil verlagen. Hij past de principes van EBM toe: op basis van bestaand bewijs de conclusie trekken dat het voorschrijven van pil A vermoedelijk beter is dan niets doen, ondanks de kostprijs van pil A.

Ethiek van gerandomiseerd onderzoek

Deelnemers aan medisch onderzoek een neppil geven klinkt wat akelig. Toch is dit bijzonder ethisch. Je weet immers niet of pil A wel werkt. Dat is het centrale principe van de ethiek van gerandomiseerd onderzoek: eerlijke onzekerheid over de baten van een medicijn. Als je eerlijk onzeker bent, hebben de deelnemers aan trials steeds een beter lot dan de niet-deelnemers. De controlegroep krijgt de best bekende behandeling. Dat is een heel belangrijk principe van gerandomiseerd onderzoek, dat vaak wordt verkracht door de farmaceutische en academische industrie. Een pil is gauw beter dan een slechte behandeling. De groep die het medicijn of de nieuwe behandeling test, is mogelijk beter af dan de controlegroep, maar loopt ook het risico op schade. Het zou bepaald niet de eerste keer zijn dat pil A goed leek in theorie, maar slecht was in de praktijk. Daarom vormt goed gecontroleerd gerandomiseerd onderzoek de hoeksteen van EBM.

Terug naar screeningstrials
Je kunt er niet omheen: de enige manier om te bewijzen of kankerscreening werkt is gerandomiseerd onderzoek. Als je vrouwen met screening vergelijkt met vrouwen zonder screening spelen altijd de vermelde vertekeningen. Vrouwen die zich laten screenen zijn gezondheidsbewuster, welvarender en beter geschoold dan vrouwen die zich niet laten onderzoeken. Pseudodiagnose, vertekening door duurtijd en door vervroeging leveren een schijnbaar fantastische verbetering van de prognose. Er sterven nochtans mogelijks, ondanks borstkankerscreening, exact evenveel vrouwen aan borstkanker en exact op hetzelfde moment.
Screeningstrials zijn onmogelijk moeilijk. Oudere trials maakten onherstelbare fouten. Bij screening worden vrouwen uitgenodigd voor onderzoek; anderen niet. Bij sommige van deze vrouwen ontdekte men een significante (en potentieel gevaarlijke) borstkanker, ook zonder mammografie. Deze vrouwen werden onmiddellijk doorverwezen naar een chirurg en uitgesloten van het verdere onderzoek. En dat is een cruciale fout. Uiteraard moeten ze onmiddellijk worden doorverwezen, maar ze mogen niet worden uitgesloten. De controlegroep bevat namelijk evenveel vrouwen met een significante (en potentieel gevaarlijke) borstkanker, die, omdat ze niet worden onderzocht, niet worden ontdekt en niet worden uitgesloten.
Je kunt proberen de vergelijking te maken tussen een bevolking die een echte pil krijgt en die een neppil krijgt, maar je kunt geen nepscreening lanceren. Screening heeft nare gevolgen die je niet vindt in de groep die geen screening krijgt. We hebben ze net besproken. Veel vrouwen krijgen de diagnose borstkanker aangesmeerd, door het ontdekken van ‘hondjeskanker‘ (pseudokanker of traag groeiende, goedaardige kanker). Het betreft vrouwen op middelbare en oudere leeftijd, waarvan één op vijf binnen afzienbare tijd zal sterven aan een groot veelvoud van ziekten. In de screeninggroep krijgen een groot aantal vrouwen het etiket ‘borstkanker’. Dat etiket riskeert te blijven ‘plakken‘ wanneer ze overlijden aan een onzekere doodsoorzaak. Dat heet ‘vertekening door etikettering‘ of sticky bias. Ze kregen de diagnose ‘borstkanker’, ze sterven, dus zal het wel aan borstkanker zijn. Je riskeert dus dat de sterftecijfers van borstkanker foutief hoger komen te liggen.  Mensen kregen ten onrechte de “sticker” borstkanker opgeplakt, terwijl ze stierven aan wat anders.
Aan de andere kant worden vrouwen die zich laten screenen veel vaker behandeld voor borstkanker. Dat veroorzaakt stress en bijwerkingen, waarvan sommige fataal zijn. Bestraling van de linkerborst beschadigt niet zelden het hart. Sterfterisico’s concurreren: de snelste en goedkoopste manier om de sterfte aan borstkanker te verlagen, is de sterfte aan hart- en vaatziekten te verhogen. Mensen krijgen dan geen borstkanker, omdat ze eerder dood gaan aan hartziekte. Het wordt goed verborgen gehouden, maar deze sterfte door hart- en vaatziekte neemt toe in trials. Omdat we enkel relatieve veranderingen goed kunnen waarnemen en hart- en vaatziekten veel voorkomen, is deze toename statistisch niet aantoonbaar, maar ze is er wel. De ware doodsoorzaak had dan eigenlijk borstkanker moeten zijn, maar dat wisten we niet: de ware doodsoorzaak is ons ontsnapt. Dat heet ‘vertekening door glibberigheid (van doodsoorzaken)’ of slippery bias.

Meta-analysen
Screeningstrials zijn bijzonder moeilijk uit te voeren. Er zijn heel veel manieren om het verkeerd te doen, en gynaecologen staan zelden bekend om hun grote methodologische kennis. Daar heeft de Evidence Based Medicine nog een laatste bescherming tegen: de meta-analyse. De meta-analyse vergelijkt meerdere trials met elkaar, en vergelijkt meerdere resultaten met elkaar. Meta-analysen tonen steeds enig onprettige waarheden – borstkankerscreeningtrials zijn daarop geen uitzondering. Ten eerste: hoe methodologisch minder goed een onderzoek is uitgevoerd, hoe groter het positieve effect. Als je heel veel geld hebt verzameld en heel veel moeite hebt gedaan om een trial te organiseren, wil je ook dat die je naar de mond praat. Desnoods zul je het onderzoek een handje helpen. Dat is erg gemakkelijk in borstkankerscreeningstrials: het volstaat om enthousiast onzekere doodsoorzaken toe te kennen aan borstkankersterfte in de controlegroep, en aan iets anders in de interventiegroep. Gotzsche en zijn medewerkers vonden dat er in de borstkankerscreeningstrials wel een verschil is in borstkankersterfte ten voordele van screening, maar helemaal geen verschil in totale kankersterfte. Dat is onverwacht, gezien borstkankersterfte een grote oorzaak van kanker is. De methodologisch best uitgevoerde onderzoeken tonen het geringste effect, of zelfs helemaal geen effect. Ten tweede: hoe beter de resultaten zijn (hoe meer een interventie effect heeft), hoe vaker een onderzoek wordt geciteerd – dat gaat tot een factor tien tot honderd maal. Zo krijgt de drukbezette arts een volslagen verkeerd idee over de voordelen van een interventie. De slecht uitgevoerde trials met de beste resultaten worden voortdurend geciteerd, de goed uitgevoerde trials die geen effect aantonen worden nooit geciteerd.

De resultaten van de borstkankerscreeningtrials die goed genoeg zijn bevonden, komen in grote diversiteit: van 0 tot 45% minder borstkankersterfte bij vrouwen. De beide trials die deze laatste heel hoge daling van de sterftecijfers claimen, verzameld in de Zweedse ‘Two County’-studie, zijn betwistbaar. Bij heranalyse van de doodsoorzaken door een onafhankelijke groep Zweedse groep onderzoekers – overigens voorstanders van borstkankerscreening – verdween het effect in een van beide Counties bijna volledig (het daalde tot 10%, wat statistisch niet significant was). Borstkanker is in het geheel van de sterfte toch een vrij zeldzame doodsoorzaak. Onzorgvuldig toekennen van doodsoorzaken veroorzaakt heel snel een signaal: het was al eerder opgemerkt dat de borstkankersterfte in de controlegroep onwaarschijnlijk hoog was. De andere County was het enige onderzoek dat deelname weigerde aan deze Zweedse meta-analyse. Dat suggereert dat ze wat hebben te verbergen. Geloof of geloof het niet (ik vind het nog steeds moeilijk te geloven), maar de resultaten van deze ongeloofwaardige trial worden niet alleen nog altijd ijverig geciteerd; ze vormen ook de basis van alle ‘wiskundige modellen’ van de screeningindustrie. Selectieve citatie is, dankzij het wiskundige model, door de academische industrie tot kunstvorm verheven.

In de volgende hoofdstukken lees je over specifieke vormen van kankerscreening. Iedere vorm is anders, maar de principes zijn vaak hetzelfde.


Literatuur

Black, W. C. and H. G. Welch (1993). "Advances in diagnostic imaging and overestimations of disease prevalence and the benefits of therapy." N Engl J Med 328(17): 1237-43.
Black, W. C., D. A. Haggstrom, et al. (2002). "All cause mortality in randomized trials of cancer screening." J Natl Cancer Inst 94: 167-73.
Cole, P. H. and A. S. Morrison (1980). "Basic issues in population screening for cancer." J Natl Canc Inst 64: 1263-72.
Grimes, D. A. and K. F. Schulz (2002). "Uses and abuses of screening tests." Lancet 359(9309): 881-4.
Kramer, B. S. and J. M. Croswell (2009). "Cancer screening: the clash of science and intuition." Annu Rev Med 60: 125-37.

Geen opmerkingen:

Een reactie plaatsen