なぜプラセボ群だけが？

なぜかプラセボ群だけが不利になった
ー新規血糖降下薬の安全性検証試験に見られた血糖コントロールの群間不均衡についてー

「血糖を下げるのに心血管系へのリスクがあるだって？！そんな薬をなぜ承認したのか？」

1．新規血糖降下薬の心血管系安全性検証：ことごとく外れた FDAの目論見
ロシグリタゾン問題で懲りたFDAは，新たに承認された血糖降下薬について心血管系への安全性を評価するよう08年から企業に求めてきた．その結果が近年NEJMに次々と発表されている．一連の試験に共通するプラセボ対照非劣性というデザインは承認後に厳密に安全性を検証するためである．二重盲検ランダム化は，もちろん様々なバイアスを排除するためである．中でも重要なのが血糖値だ．

血糖降下薬には血糖を下げることによって心血管イベントを抑制する有効性がある「ことになっている」．その血糖降下薬に心血管イベントを増加させるリスクがあるかどうかを検証する試験では，有効性がリスクを隠してしまわないように，交絡因子となる血糖値を，群間で差が生じないような厳密にコントロールする必要がある．

このため，FDAが企業に課した一連の試験でも，両群で平等に血糖コントロールを最適化できるよう，類薬（たとえば，DPP-4阻害薬が試験薬の場合には他のDPP-4阻害薬とGLP-1アゴニスト）以外の血糖降下薬を適宜追加，増減できるプロトコールになっていた．こうすればランダム化のデザインにより，両群間で血糖コントロールの差は生じない「はず」だった．ところが，これまでの試験ではFDAの目論見はことごとく外れてきたように見える．

少なくとも私が論文を読んだ，SAVOR-TIMI 53、EXAMINE、ELIXA、TECOS、EMPA-REG-OUTCOME、LEADERの、6つのプラセボ対照非劣性二重盲検ランダム化試験についてはそうだ。

2．典型的な失敗試験だったSAVOR-TIMI 53
ロシグリタゾンと同様に心不全を増加させる結果が出てしまったのが，サキサグリプチンの安全性を検証したSAVOR-TIMI 53試験である．複合エンドポイントである主要評価項目ではプラセボとの間に有意差はなかったが，事前設定の二次エンドポイントだった心不全による入院が実薬群で増加（HR 1.27, 95% CI, 1.07-1.51, p=0.007）していた．問題はそれだけはなかった．

この試験でも，両群で DPP-4阻害薬とGLP-1アナログ以外の血糖降下薬を適宜追加，増減できるプロトコールになっていた．ところが，どういうわけか空腹時血糖，HbA1cともに，プラセボ群が明らかに不利になっていた（全期間を通じてp<0.001．論文本文並びにSupplementary Appendix Table S2. Metabolic Changes During the Study）．血糖コントロールがプラセボより良好という「下駄」を履かせてもらっていたにも関わらず，心血管イベント抑制効果でプラセボに勝てなかった．つまり下駄がなければ負けていた可能性が否定できない．血糖とは独立した心血管系へのリスクという仮説の検証に失敗したのだ．

たとえ失敗試験であっても，良識ある研究者ならば，試験に協力してくれた被験者に報いるためにも，事後解析として空腹時血糖値とHbA1cでそれぞれ補正をかけ，改めて主要評価項目を比較したデータを示し，その結果に対する考察を加えて投稿したはずだ．ところが当のSAVOR-TIMI 53試験論文は，血糖コントロール指標で明らかな群間差があったデータをそのまま示しているだけだ．

同様のプラセボ群における血糖コントール不利の問題は，判で押したように他の試験でも発生した．新規血糖降下薬では2013年以来国内トップの売り上げを誇るシタグリプチン（TECOS試験），心血管イベント抑制のエビデンスが得られたと，得意満面のエンパグリフロジン（EMPA-REG-OUTCOME試験）やリラグルチド（LEADER試験）でも，全観察期間にわたってプラセボ群の方でHbA1cが有意に高くなっていた．

エンパグリフロジンにせよ，リラグルチドにせよ，血糖コントロールが不利になったプラセボ群に「勝った」だけで，血糖とは独立した心血管系へのリスクの検証には失敗したのである．さらに，どちらの論文にも，HbA1cで補正して改めて主要評価項目を比較した結果も，なぜプラセボ群の方が一方的に不利になったかの考察も，一切なかった．NEJMの読者も随分と馬鹿にされたものだ．

参考→誇大広告代理店と化したNEJM，

3．群間不均衡が回避されるように計画はされてはいたのだが
糖尿病は治療方針が確立されている疾患だから、プラセボ、実薬どちらか一方の群だけがコントロールの悪い状態に放置されることがあってはならない。一連の新規血糖降下薬の安全性検証試験で、もしプラセボ群で糖尿病のコントロールが悪ければ：

１．安全性の判断に対する重大なバイアス（交絡因子）になる。どんな有害事象にせよ、その有害事象がたとえプラセボ群で有意に高かった（＝実薬群で有意に低かった）としても、「それは実薬が安全だったからではなく、プラセボ群が危険な状態に放置されていたからだ」と言われておしまいだ。
２．それ以前に、倫理的に重大な問題になる。既存治療が確立されているにもかかわらず、プラセボ群を十分に治療しないのは、明らかにヘルシンキ宣言違反である。

それゆえ、上記のどの試験でも、診療ガイドラインに沿ったプロトコールが作成され、試験が設計されていた．具体的には、いずれの群でも、実薬と同種同効能以外の薬ならば、オープンラベルで自由に追加投薬可能とすることにより，両群同様にHbA1cを6.5%あるいは7.0%以下に保つことが奨励されていたのである。下記に示す論文あるいはプロトコールからの抜粋でも、その旨が明確に述べられている。

TESCO試験論文から
(Randomization and Study Medication) Since sitagliptin lowers the glucose level, patients in the sitagliptin group would be expected to have lower glycated hemoglobin levels
than those in the placebo group initially. During the study, the use of open-label antihyperglycemicagents was encouraged as required, with the aim of achieving individually appropriate glycated hemoglobin targets in all patients. This approach was taken to permit the assessment of possible drug-specific effects by minimizing potential confounding effects of differential glucose control.

TESCO試験のプロトコールから
1.3 ACHIEVING GLYCEMIC EQUIPOISE AND RATIONALE FOR　PLACEBO COMPARATOR
A placebo comparator is necessary for this trial because the CV impact of other oral AHAs (such as sulfonylureas or thiazolidinediones) is not sufficiently well-established to serve as a benchmark for CV outcomes. Since better glycemic control vs. placebo may itself lead to CV outcomes in favor of sitagliptin, the study has been designed to optimize the likelihood of achieving glycemic equipoise in the two arms, considering that the trial is conducted in the setting of usual care. In particular, usual care providers will be encouraged by study investigators to adjust subjects’ antihyperglycemic regimens (using any oral agent deemed appropriate, except for other DPP-4 inhibitors or GLP-1 analogues) in order to achieve appropriate HbA1c goals, taking into consideration each subject’s individual needs as well as applicable regional guidances (e.g., < 6.5%, [International Diabetes Federation], <7.0% [American Diabetes Association]).

LEADER試験のプロトコールから

２．プラセボ群の方が不利となる大失態をとぼけ通す研究者、DSMB、NEJM編集部、そして査読者達（そんなものがいたらの話だが）

ところがいざ開鍵してみると，どの試験でも、実際にはプラセボ群の方が試験期間中を通して、血糖コントロールが大幅に悪かった（例　LEADER試験の場合：Suppplementary Appendix Figure S5A）．すなわち、試験期間中を通して、盲検をかけていたにもかかわらず、プラセボ群を決定的に不利にする力＝実薬群を決定的に有利にする力が働いていたのである。プロトコールに従って，オープンラベルの追加投薬が行われ，しかも，（当然ながらリラグルチドを投与していない分）追加投薬がプラセボ群の方で多かったにもかかわらずである（例　LEADER試験の場合：Suppplementary Appendix Tabel S4）。

このように、LEADER試験以外の試験でも、プラセボ・実薬両群で適切な血糖コントロールが行われるように計画されていたにもかかわらず、その計画に反して，試験期間を通じてプラセボ群の血糖コントロールの方が明らかに悪い状態が続いていた。どの試験でも、プロトコールに従って，オープンラベルの追加投薬が行われ，しかも，（当然ながら実薬を投与していない分）追加投薬がプラセボ群の方で多かったにもかかわらずである。

それぞれの試験における各群のHbA1cの経過図→TECOS、EMPA-REG-OUTCOME、ELIXA、EXAMINE、LEADERを見ると、どれも見事までに試験期間中を通してプラセボ群で血糖コントロールが悪いことがわかる。安全性を検証する試験で、事前に交絡因子を調整する計画が組まれていたにもかかわらず、安全性に重大な影響を与えるバイアスが排除できなかったのだから、完全な失敗試験である。ところが、どの論文でも、その失敗を失敗と認めていない。辛うじてTESCO試験の論文で次のような記載が見られるのみである。
(Limitations) Potential biases are the possible confounding effects on cardiovascular outcomes by the small residual between-group difference in the glycated hemoglobin level and the greater use of antihyperglycemic agents in the placebo group.

ELIXA論文ではこの点については両群におけるHbA1cの経過をResultで説明するのみでDiscussionでは全く触れていない。LEADER論文でも、ELIXA論文と同様の扱いだが、こっちはご丁寧にHbA1cの経過図を論文には出さずにAppendixに載せて隠したつもりになっている。呆れた猿知恵だが、図々しさという点では、次のEMPA-REG-OUTCOMEに負ける。EMPA-REG-OUTCOME 論文に至っては、プラセボ群でHbA1cが全く下がらなかったこと（プラセボ群の医者どもは一体全体何をやっていたのか？）には一言も触れずに、実薬群で心血管イベントが少なかったのは、あたかも「エンパグリフロジンが有効だったから」との嘘八百を平気で並べ立てている。実薬群で心血管イベントが少なかったのではなく、血糖コントロールが不当に悪かったプラセボ群で心血管イベントが多かっただけだというのに。

糖尿病患者における血糖コントロールのような極めて重要な因子の交絡を排除できなければ、試験結果が全体にわたって毀損される。あらゆる有害事象の頻度について、たとえ統計学的な有意差がなくても、「それは実薬の安全性に問題がないという結論にはならない。なぜならプラセボ群が血糖コントロールで不利な状態に置かれていたからである。もしも両群で血糖コントロールが同様であれば、実薬の有害事象が相対的に浮き出てきたであろうに」と反論され、試験結果が全て否定されてしまう。その最悪のシナリオが現実に起こったというのに、どの論文でもしらばっくれてやり過ごしている。これが研究者のやることか。

また、こういう恥さらしな論文が全て表沙汰，つまりNEJMに掲載されるということは、
１．データ安全性モニタリング委員会(DSMB)が全く機能していなかった。
２．必ず複数の生物統計家が入るはずのNEJMの査読も全く機能していなかった。（ってえか、全く査読スルーで談合しただけっていうのが見え見えだぜ）

さて、表題の「なぜプラセボ群の方だけが血糖コントロールが悪くなったのか？」だが、以下はあくまで私個人の推測であり、客観的な根拠があるわけではない。ただ、下記以外の説明が思いつかないのは事実だ。もし下記以外の説明をご存じの方はご教示願いたい。

私が考える理由は簡単だ。「盲検が破れていた」ただそれだけ。LEADERのSuppplementary Appendix Figure S5Aが一番雄弁である。プラセボ群では、試験期間中HbA1cの平均値が8.0を下回ることはほとんどなかった。一方リラグルチド投与群では、治療開始後3ヶ月のfirst visitで7.0％をやや上回るところまで低下し、それ以後も常にプラセボ群よりも低い値を保っていた。プラセボ群の患者は、リラグルチド投与群よりもはるかに劣悪な血糖コントロール状態＝リラグルチド群よりも心血管イベントリスクの高い状態に試験期間中ずっと放置されていた。このような異常な不均衡を、盲検が破れていたこと以外で考えられるだろうか。

なぜ盲検が破れていたかの理由もSuppplementary Appendix Figure S5Aが説明してくれている。first visitでプラセボと実薬の間にこれだけ差があれば、どんな馬鹿な医者でも、自分の患者がプラセボか実薬かはわかるぜ。血糖降下作用だけは一人前の薬を最大用量使えば、当たり前だよな。

2017年8月31日追記
-----------------------------------------------------------------------
Novo社　GLP-1薬Victozaによる心血管有害転帰予防をFDAが承認 BioTodayニュースレター 2017年8月31日
心血管疾患（CVD）併発2型糖尿病患者の重大心血管有害転帰（心臓発作, 脳卒中, 心血管死）リスクを下げるのにNovo NordiskのGLP-1類似薬Victoz（liraglutide）を使うことを米国FDAが承認しました。重大心血管転帰を生じやすい2型糖尿病患者9,340人が参加した試験（LEADER）の3.5-5年間の追跡調査の結果、心臓発作・脳卒中・心血管死の発現がVictoza治療群の方がプラセボ群より低いことが示されています（13.0% vs 14.9%）。より具体的には、Victozaは心血管死や死亡全般を減らします。

Victoza approved in the US as the only type 2 diabetes treatment indicated to reduce the risk of major adverse cardiovascular events
Liraglutide Indicated to Reduce Risk for Cardiovascular Events

→目次へ戻る