What is the systematic review?

　Evidence-based Laboratory Medicine（EBLM）の実践は、これまで治療介入の分野で培われてきたEvidence-based Medicine（EBM、入手可能で最良の科学的根拠を把握した上で、個々の患者に特有の臨床状況と価値観に配慮した医療を行うための一連の行動指針［福井次矢氏による］）の手順に、臨床検査独自の検討項目を加味したものとなる。即ち、（１）患者の診療上の問題を整理して論理的に記述し、（２）該当するエビデンス、つまり検査の性能を示す証拠をできるだけ網羅的に探し、（３）その中で科学的な根拠を選別し、必要に応じ複数の根拠を総合したうえで、（４）患者固有の臨床的状況と本人の意向を考慮に入れ、検査を実施すべきか、実施するならどの検査を選ぶかを判断する。
　例えば「新生児感染症が疑われた症例には高感度CRPを測定すべきか」という問題を考えてみよう。この際特にEBLMを意識しなければ、関係のありそうな医学雑誌の特集号を探すか、MEDLINEや医学中央雑誌で文献を検索し、総説が見つかればそれを、見つからなければ個別の研究の結果を参考にする。ところが実際にやってみると、文献によって対象患者、測定法、カットオフ値、そして結論である診断精度がまちまちで、どれを信用していいのか分からない。このような状況で威力を発揮するのが、前述の（２）と（３）のステップであり、この過程を系統的レビュー(systematic review)と呼ぶ。
　各ステップについては各々別項にて詳述されるので、本稿ではそれらの理解の一助となるよう、いわゆる総説（レビュー）と比較した場合の系統的レビューの特徴と、臨床検査医学固有の課題について概説する。
I．文献検索における特徴
　前述のステップ（２）で探すべき対象となる文献は、いわゆる学術論文に限らない。場合によっては診療録や未発表の研究データなども大切な証拠となりうる。ただし、学術論文は内容の質が編集者によってある程度担保されていることや、データベース化が進んでいるために、現状ではそれらの検索が中心となっている。総説において検索対象は著者の恣意に任されるが、系統的レビューでは次の理由から網羅性を追求する。
（a）研究費の負担者が期待するような、あるいは研究者自身が期待するような結果が得られた研究ほど、論文として著名な雑誌に掲載されやすい。
（b）研究者によって結論が一致しない研究課題でも、複数の根拠を統計的に統合すれば、信頼に足る結論が得られる可能性がある。
（c）著名な雑誌の査読者が、常に優れた査読者であるとは限らない。
　そこで、該当しそうな文献をできるだけもれなく、かつ余計なものが紛れ込まないよう、効率よく検索するノウハウが必要になる。例えば検索のキーワードとして「新生児感染症」という用語がよいか、あるいは「新生児」と「感染症」に分けて別々に検索し、その積集合をとった方がよいかなど、さまざまな組み合わせを取捨選択しなくてはならない。

II．検索された文献の吟味における特徴
A．科学的かどうか
　総説には大概著名な雑誌に掲載された論文が引用され、その信憑性や質については各雑誌の査読者や編集者を信頼することになる。一方系統的レビューでは、次のような理由から、論文の内容が科学的かどうかを改めて批判的に見極める。
（a）故意あるいは不注意により、研究費の負担者が期待するような、あるいは研究者自身が期待するような結果が得られる方向へのバイアスが入りやすい。
（b）研究費の負担者及び研究者にとって、限られた研究資源をバイアスの除去のために振り向けるインセンティブが乏しく、おろそかになりやすい。
　なお、ここで「科学的」という言葉の意味を誤解しないよう注意が必要である。即ちこれまで人類が得た医学的根拠は、実際に試した結果に基づく帰納的なものがほとんどである。したがって、個別の問題毎に必ずしも適合する根拠が得られるとは限らないうえ、たとえ得られたとしても、集団で証明された根拠が目の前にいる患者に当てはまるという保証はない。したがって「科学的根拠」とは、科学的に真実と考えられる根拠、という意味ではなく、科学的に正しい方法で試すことによって得られた根拠を意味する。
　そこで系統的レビューにおいては、各々の根拠を得るのに用いた方法が、科学的に正しかったかどうかを吟味する。その際、試すという行為にはさまざまな落とし穴がつきもので、少しでもうっかりすると偏った結果を招くことに十分注意を要する。例えば前述の例で、高感度CRPが正常値を示したために確定診断に至らなかった症例を検討対象から除いてしまうと、偽陰性率は真の値より低く、偽陽性率は高く算出されてしまう。そのような問題点を見落とさないためには、統計学と医学の知識、および医学研究についての豊富な経験を背景とし、批判的に吟味することが求められる。
B．最良かどうか
　前述のEBMの説明の中で、「科学的根拠」の前に「入手可能で最良の」という言葉が付されていたのを思い出して頂きたい。即ち、医学研究にはさまざまな制約が不可避であり、ある問題については科学的レベルの低い根拠しか得られない場合もあり得る。そのような場合に、「信頼できる根拠はない」と切り捨てることなく、次善であっても最良の選択をしようとするのがEBMの精神である。したがって次に例示するようなバイアスは許容され、入手可能な根拠が科学的レベルの低いものだけならば、それを「最良」と考え採用する。
（a）既知のバイアスについて、取り除くための最善の努力がなされ、かつそれが明記されている。
（b）未知のバイアスが潜在している可能性は常に残り、取り除くことは不可能である。
（c）既知のバイアスでも、たとえば倫理的に許されない方法でしか取り除けない場合。
　あるいは科学的に試されているにも拘わらず、研究者によって結論が一致しない場合もあるが、それでも直ちに信憑性が否定されるということにはならない。メタアナリシスという手法でそれらの結果を統計的に統合すれば、信頼に足る結論が得られる場合があり、そのときにはそれが最良の科学的根拠として採用される。

III．臨床検査医学固有の課題
A．臨床検査データ特有の指標の評価
　臨床検査の診断性能を「科学的に正しく試す」ためには、臨床検査データに大きく影響する測定精度、測定法の標準化、基準値、サンプリングの諸問題等を正しく制御することが不可欠であり、その手法を独自に確立する必要がある。
B．診断精度の評価指標
　治療介入の評価にはその有効率を用いればよいが、臨床検査は診断を目的として行われ、直接患者の予後を左右する医療行為ではないので、何を評価の指標にするか、すなわち「どういう検査がよい検査といえるのか」という問題が生じる。これには大きく分けて２つの考え方があるが、どちらの考え方にも賛否両論あり、今のところ結論を下すのは容易でない。
　ひとつは、最終目標を「正しい診断を得ること」だと読み替え、新たに必要となる評価手段やメタアナリシスの手法をEBMの既存の方法論に追加していくという考えである。いまひとつは、検査という行為そのものを治療と同じ医療行為のひとつと捉え、治療法を評価する方法をそのまま適用して、検査を実施することが患者の予後を改善するかどうかで評価しよう、という考えである。これは、いかに正しく診断できる検査であっても、もし治療方針に何ら影響を与えず、したがって予後にも影響を与えないなら、その検査を実施する意味はない、とする主張に通ずる。
C．診断性能の評価に常用される症例対照研究の限界
　治療法を評価する実験では、条件を揃えた２群の患者の一方だけを治療し、治療しない群と予後にどれだけ差が出るかどうかを調べる。また、将来ある病気になるかどうかを、どれだけ正しく予測できるかを評価するためには、ある集団を検査結果で２群に分け、その他の条件を揃えたうえ、発症率にどれだけ差が出るかを調べる。これらの方法は統計学的に確立されており、それぞれの指標の値はそのまま優劣を表す科学的根拠として用いることができる。
　ところが、臨床検査が最もよく使われるのは、病気の診断である。病気かどうかをどれだけ正しく診断できるかを評価する目的で、患者とそれ以外の２群に分けて検査を実施し、陽性率にどれだけ差が出るかを調べようとしても、この２群間で条件を揃えることはきわめて困難である。例えば患者以外の群を健康人とするか、異なる疾病の患者とするかによって、導かれる結論がまったく異なる可能性がある。
　さらに臨床現場で検査が使われる状況を考えれば、疾患の経過中のその時々に見られる病態において、さらにこの先判別すべき２群を、どの検査がもっとも鋭敏に峻別できるか、という指標が求められる。このような指標をすべての病態についてあらかじめ用意しておくことは不可能であり、かつ複数の検査を組み合わせて診断する場合には適用できない。したがって、現状では臨床的ニーズのごく一部を満たすことしかできないため、多変量解析などを応用した独自の評価手法を新たに開発する必要がある。
D．検査診断領域の共同作業の遅れ
　現代医療において系統的レビューの必要性は益々高まっているが、膨大な作業を要する。そこで作業を手分けして得られた結果を皆で利用するため、コクラン共同計画という国際的な組織が作られ精力的に活動している。しかし、検査診断領域を専門とする作業グループは未だに設置されていない。また文部科学省Evidence-based Diagnosis研究班の調査によると、2001年第１版のコクランライブラリに収載された系統的レビュー総数1,000件のうち、診断手法に関するものは36件で、さらに臨床検査・生理機能検査に絞るとわずかに５件であった 1) 。医療のあらゆる分野に広く臨床検査が利用されていることを考えれば、このような現状は著しく遅れていると言わざるを得ず、臨床検査医学界に身を置くひとりひとりの一層の奮起が望まれる。

IV．まとめ
（a）EBMは帰納的根拠の持つ限界を大前提とし、その内側で最善を尽くすための指針である。
（b）系統的レビューは、文献検索の網羅性と得られた文献の科学的レベルについて、最善を尽くす点が総説との違いである。
（c）EBLMにおいては、治療介入の分野で培われてきたEBMの手法に、臨床検査医学独自の検討項目を加味したうえ、系統的レビューの実践に積極的に取り組む必要がある。

文　献
1）石田博、他：2000年度文部省科学研究補助金　基盤研究C(企画調査)「効率的で良質な医療を目指した病態検査の系統的再評価の基礎的検討」報告書　2001年9月10日（http://ebd.umin.ac.jp/research/summary2000.pdf）

EBLMの進め方と問題点－系統的レビューを中心に－(3)

系統的レビュー(Systematic review)とは

What is the systematic review?

Contents