4
総 論
レベル・エビデンス総体を評価し(
表1
),最終的にCQのエビデンスのレベルを決定した(
表
2
)。
4)—2 推奨の強さ
上記の作業によって得られたアウトカムとエビデンスのレベルをもとに推奨文案を作成し,
ガイドライン作成委員によるコンセンサス会議において推奨文案を評価し,推奨の強さを決定
した(
表3
)。CQ本文においては決定した推奨を直截に表現し,多様な表現を排除した。
表 1 文献レベルの分類法・エビデンス総体の評価方法
第1ステップ(各論文の評価):研究デザイン,バイアスリスク評価,構造化抄録作成
第2ステップ(アウトカムごと,研究デザインごとの蓄積された複数論文の総合評価):
① 初期評価:各研究デザイン群の評価
・システマティックレビュー群,メタ解析群,無作為化比較試験群=「初期評価レベルA」
・観察研究群,コホート研究群,ケースコントロール研究群=「初期評価レベルC」
・症例集積群,症例報告群=「初期評価レベルD」
② エビデンスレベルを下げる要因の有無の評価
・バイアスリスク(risk of bias)がある。
・結果に非一貫性(inconsistency)がある。
・エビデンスの非直接性(indirectness)がある。
・データが不精確(imprecision)である。
・出版バイアス(publication bias)の可能性が高い。
③ エビデンスレベルを上げる要因の有無の評価
・大きな効果があり,交絡因子がない。
・用量‒反応勾配がある。
・可能性のある交絡因子が,真の効果をより弱めている。
④ 上記 ①→②→③ の順に評価して最終的なエビデンス総体を判定した。
表 2 CQのエビデンスのレベルの定義
エビデンスレベルA(高):
効果の推定値に強く確信がある。
エビデンスレベルB(中):
効果の推定値に中程度の確信がある。
真の効果は,効果の推定値におおよそ近いが,それが実質的
に異なる可能性もある。
エビデンスレベルC(低):
効果の推定値に対する確信は限定的である。
真の効果は,効果の推定値と,実質的に異なるかもしれない。
エビデンスレベルD(非常に低):効果の推定値がほとんど確信できない。
真の効果は,効果の推定値と実質的におおよそ異なりそうで
ある。
表 3 CQの推奨の強さ
推奨度
1
(強い推奨)
“実施する”ことを強く推奨する。
“実施しない”ことを強く推奨する。
2
(弱い推奨)
“実施する”ことを弱く推奨する。
“実施しない”ことを弱く推奨する。