De richtlijn is (voor zover mogelijk) gebaseerd op bewijs uit wetenschappelijk onderzoek.
Er is gestart met zoeken naar systematische reviews en richtlijnen (Cochrane Library, National Guideline Clearinghouse, National Institute for Health and Clinical Excellence (NICE)). Daarna is aanvullend systematisch gezocht naar literatuur in MEDLINE, Embase en PsycINFO tot 1 april 2011.
Systematische reviews werden beoordeeld op kwaliteit met behulp van de AMSTAR-criteria [119]. De RCT’s werden beoordeeld met de Jadad-criterialijst [66]; deze meet de methodologische kwaliteit van een studie op een schaal van 0-5, waarbij punten worden toegekend voor randomisatie, blindering, uitval en drop-outs. De kwaliteit van studies werd beoordeeld als ‘goed’ als er sprake was van een adequate randomisatie en blindering, een ‘intention to treat analyse’ werd uitgevoerd en er sprake was van een follow-uppercentage van boven de 50%. De kwaliteit van studies waarbij twee of meer van bovenstaande kenmerken niet in orde waren werd beoordeeld als ‘redelijk’, de kwaliteit van studies met minder dan twee van bovenstaande kenmerken werd beoordeeld als ‘laag’.
De literatuur is samengevat en vervolgens is een conclusie geformuleerd waarbij de kwaliteit van het bewijs is aangegeven. De kwaliteit van het bewijs werd beoordeeld met behulp van GRADE [117]. GRADE is een methode die per uitkomstmaat een gradering aan de kwaliteit van het bewijs toekent op basis van vertrouwen in de schatting van het effect op basis van de indeling in tabel 9.4.1 en 9.4.2.
Tabel 9.4.1 Indeling van de kwaliteit van het bewijs volgens GRADE
hoog | Er is veel vertrouwen dat het werkelijke effect dicht in de buurt ligt van de schatting van het effect. |
matig | Er is matig vertrouwen in de schatting van het effect: het werkelijke effect ligt waarschijnlijk dicht bij de schatting van het effect, maar er is een mogelijkheid dat het hier substantieel van afwijkt. |
laag | Er is beperkt vertrouwen in de schatting van het effect: het werkelijke effect kan substantieel verschillend zijn van de schatting van het effect. |
zeer laag | Er is weinig vertrouwen in de schatting van het effect: het werkelijke effect wijkt waarschijnlijk substantieel af van de schatting van het effect. |
Tabel 9.4.2 De kwaliteit van het bewijs wordt bepaald op basis van de volgende criteria
Type bewijs |
RCT start in de categorie ‘hoog’. Observationele studie start in de categorie ‘laag’. Alle overige studietypen starten in de categorie ‘zeer laag’. |
||
‘Downgraden’ | ‘Risk of bias’ | -1 | Serieus |
-2 | Zeer serieus | ||
Inconsistentie | -1 | Serieus | |
-2 | Zeer serieus | ||
Indirectheid | -1 | Serieus | |
-2 | Zeer serieus | ||
Imprecisie | -1 | Serieus | |
-2 | Zeer serieus | ||
Publicatiebias | -1 | Waarschijnlijk | |
-2 | Zeer waarschijnlijk | ||
‘Upgraden’ | Groot effect | +1 | Groot |
+2 | Zeer groot | ||
Dosis response relatie | +1 | Bewijs voor gradiënt | |
Alle plausibele confounding | +1 | Zou een effect kunnen reduceren | |
+1 | Zou een tegengesteld effect kunnen suggereren terwijl de resultaten geen effect laten zien |
Voor het formuleren van een aanbeveling zijn naast het wetenschappelijke bewijs vaak nog andere aspecten van belang, bijvoorbeeld: patiëntenvoorkeuren, kosten, beschikbaarheid van voorzieningen of organisatorische aspecten. Deze aspecten worden, voor zover niet wetenschappelijk onderzocht, vermeld onder ‘overige overwegingen’. In de overige overwegingen spelen dus de ervaring en de mening van de werkgroepleden een belangrijke rol. De ‘aanbeveling’ is het resultaat van de integratie van het beschikbare bewijs met de weergegeven overige overwegingen.