本ガイドラインについて|改訂作業の実際(各論)

改訂作業の実際(各論)

1.作成法
  1. 統括委員会:肝癌診療ガイドラインは2005 年版(初版)が厚生労働省診療ガイドライン支援事業のサポートを受け作成された後,日本肝臓学会に改訂作業が引き継がれ,2009 年版(第2 版),2013 年版(第3 版)と4 年ごとに新しいエビデンスを取り入れて改訂されてきた。2017 年版(第4 版)では改訂委員会の上部組織たる肝癌診療ガイドライン統括委員会が日本肝臓学会企画広報委員会内に初めて設置されたが,第5 版では日本肝臓学会によるすべてのガイドラインを統括するガイドライン統括委員会(参照)が新たに組織され,改訂委員会の委員と改訂方針が決定された。
  2. 作成の基本方針:初版から第4 版までと同様,evidence based medicine(EBM)の基本理念に基づき,客観性と再現性を担保する基本方針は踏襲する。ただし,第4 版よりエビデンス一辺倒ではなく,患者の益と害のバランスや社会条件なども考慮するよう,新たに一部GRADE システムの概念を導入したが,この第5 版も第4 版の方針に従った。
  3. 2019 年7 月,暫定的メンバーによる第1 回改訂委員会により,改訂作業が開始された。新たに保険収載された薬物療法に関する随時改訂作業と並行し,2021 年発刊を目指した第5 版の大改訂を進めていく方針となった。2019 年8 月30 日に開催されたガイドライン統括委員会(参照)により,委員,委員長,副委員長の就任要件が定められ,改訂委員会の構成が確定した。日本肝臓学会会員の肝癌診療専門家が中心となり,外科医7 名,内科医10 名,放射線科医7 名,臨床統計学者1 名に加え,この第5 版より腫瘍内科医2 名に新たに加わっていただき,合計27 名で構成された(参照)。さらに,委員を補佐する専門委員を23 名,実際の作業を分担していただく実務協力者22 名に協力を仰いだ(参照)。
  4. 作成の原則:第2 回改訂委員会において,第5 版改訂の手順や細部の方針,各章の分担などを検討した。第4 版同様,EBM の方法論を尊重するものの,エビデンスとコンセンサスの間をつなぐために新たに一部GRADE システムを導入し,システィマティクに推奨を決定するという基本方針は踏襲することになった。
  5. CQ の吟味:第3 回改訂委員会より,第4 版のCQ をベースに第5 版で扱うCQ を決めていった。第4 版まで取り上げられていた各章における予後予測因子についてのCQ は,どの章でもエビデンスレベルの高い予後予測因子が存在しないことから,第5 版ではすべて削除する方針となった。また,performance status(PS)や年齢によるサーベイランス,治療選択の違いをガイドラインに記載するかどうかにつき検討したが,PS 不良や高齢であっても治療効果があるという論文が出版されやすく(いわゆる選択バイアスや出版バイアス),既報に基づいてPS や年齢に関するCQ や推奨文の作成を行うと,PS や年齢にかかわらず治療を推奨するという結論になってしまう可能性があるということで,第5 版ではPS や年齢に関するCQ は扱わないことにした。最終的に第4 版のCQ55 件から廃止・統合・新設などの作業を経て,第5 版では合計52 件のCQ とした。改訂のなかった,あるいは微修正にとどまったCQ は41 件,6 件の改訂が行われ,5 件のCQ が新設された。
  6. 記載方法:第4 版と同様,サーベイランス・診断と治療アルゴリズム,続いて肝細胞癌の予防,手術,穿刺局所療法,肝動脈化学塞栓療法,薬物療法,放射線治療,治療後のサーベイランス・再発予防・再発治療という9 つの章立てとした。
  7. Web-based Guideline 作成システム:第5 版改訂では従来の外部委託は行わず,平成31年度(令和元年度)厚生労働行政推進調査事業費補助金(肝炎等克服政策研究事業)「肝癌・重度肝硬変の治療に係わるガイドラインの作成等に資する研究」(研究代表者:小池和彦)の研究費を用いて構築されたガイドライン作成システムを利用することになった。本システムは,1)ガイドライン作成において最も時間のかかる論文選択を効率的に行える,2)複数の査読者による選択論文の不一致解消をリアルタイムに行える,3)二次選択における論文PDF ファイルの配布を事務局が代行できる,などの利点があり,さらに外部委託費の節約にもつながった。
  8. エビデンスレベル,推奨の強さ:ガイドライン作成の原則は第4 版までと同様にEBMの方法論を尊重したが,個々の文献のエビデンスレベルの評価は行わず,各CQ に関するエビデンス総体につき,そのレベルを委員会の合議により決定した(図11)。エビデンスレベルの評価基準については参考2)参照)に示した。また,エビデンスとコンセンサスの間をつなぐため,第4 版と同様,一部GRADE システムを導入して推奨を決定することとしたが,第5 版ではDelphi 法による無記名投票を実施する方針とした。その方法(議決権の定義,COI に応じた議決権行使の制限,投票の手順など)は改訂委員会内で素案を作成し,ガイドライン統括委員会に諮り,承認を得た(下記に詳述)。また,推奨決定に至るまでの委員会での議論はできるだけ各CQ の解説に記載することにした。
図1 エビデンス評価Table

1)

第1 回委員会:2019 年7 月5 日(ホテル椿山荘東京)
第2 回委員会:2019 年10 月15 日(日本外科学会事務局)
第3 回委員会:2020 年1 月14 日(日本外科学会事務局)
第4 回~第22 回委員会(すべてWeb 開催):2020 年6 月5 日,7 月30 日,9 月1 日,10 月15 日,12 月10 日,2021 年1 月7 日,1 月21 日,2 月4 日,2 月17 日,3 月3 日,3 月11 日,3 月18 日,3 月24 日,4 月1 日,4 月8 日,4 月14 日,4 月22 日,4 月28 日,5 月28 日

2.文献検索と選択の方法
  1. まず,各CQ について,主副の2 名の担当者を決めた。主担当がそのCQ に関する責任をもつが,副担当の目を通すことで,客観性を保ちつつ,漏れや見落としを防ぐ目的がある。
  2. 数個のキーワードを選定し,委員および専門委員により検索式を策定した。主副担当は独自に必須文献をあらかじめ選定しておき,検索式による文献検索により,その文献が含まれるかをチェックした。すべて含まれていれば,検索式の妥当性が確認されたと解釈し,含まれなかった場合は,検索式の修正を行った。
  3. 系統的文献検索は2021 年1 月末のePub 公表分まで行い,それ以降に発表された重要なエビデンスについては個別に評価し,日常臨床へのインパクトが大きい場合のみ例外的に採用した。論文のみならず,米国臨床腫瘍学会(ASCO)などの重要学会で発表された抄録も対象に含めることにした。海外で有効性が認められているが,日本で現実的には実施不能な治療については,推奨の形はとらないが,本文中で解説を加えることにした(第4 版と同様)。
  4. 検索式により抽出された文献のなかから主副担当が実務担当者のサポート下で,独立して一次選択を行った。お互いの判断を突き合わせ,過不足を調整し,最終的な一次選択文献を決定した。
  5. 一次選択文献を入手し,その内容をチェックし,主副担当が独立して,二次選択を行った。お互いの判断を突き合わせ,過不足を調整し,最終的な二次選択文献を決定した。
  6. 二次選択文献を主副担当が独立して読み込み,改訂委員会で定めたAbstract Table(図2)を作成した。Abstract Table では最終的にガイドラインの推奨や解説に載せる文献の採否も記載し,主副担当の意見を突き合わせ,合議により,最終採否を決定した。
図2 Abstract Table

3.推奨の決定
  1. Abstract Table の完成したCQ につき,推奨草案を主副担当の合意の下,作成した。
  2. 審議対象となるCQ とそれに対する推奨文は会議前に回覧し,問題点はメール審議である程度解決しておく。
  3. COI により議決権放棄となる委員は委員長と副委員長の合議により,事前に決めておく。ただし,放棄した委員も議決前の議論には加わっていただく。
  4. まず,CQ 担当委員から提案した推奨草案に至った経緯を説明していただく。
  5. さらにエビデンス評価Table にあるエビデンス総体の総括,推奨の強さを決定するための評価項目につき,委員会としての統一見解を投票の前に決めておく。
  6. 上記見解を踏まえ,またDelphi 法に準拠し,投票前には推奨度をどう考えるべきかを十分に議論する。ガイドラインの基本方針として,「推奨なし」も1 つの選択肢ではあるが,できるだけ避ける,という点を全委員に周知する。
  7. 第1 回目投票(Google フォームによる無記名投票,委員長・副委員長も参加)を行う。推奨の程度を示す,行うことを強く推奨する,行うことを弱く推奨する,行わないことを弱く推奨する,行わないことを強く推奨する,のうち1 つを選択してもらい,有効投票(議決権放棄者を除く)の70%の同意集約をもって,全体の意見とする。70%に至らなかった場合,投票結果(各項目の投票数と割合)を公表したうえで,再投票に向かう。
  8. 再度,問題点を絞って,十分議論したうえで,第2 回目投票(無記名,委員長・副委員長も参加)を行う。70%に至らなかった場合,投票結果を公表したうえで,再投票に向かう。
  9. 再々度,問題点を絞って,十分議論したうえで,第3 回目の投票(無記名,委員長・副委員長も参加)を行う。これでも70%に至らなかった場合,「推奨なし」とする。
  10. 議決権については基本的にガイドライン統括委員会から承認された委員のみが有することとし,経済的COI のみならず,学術的COI(各CQ で引用された参考文献の著者はすべて学術的COI に該当すると定義)も勘案し,該当者は自主的に議決権を放棄した。委員が欠席する際,その委員が指名する専門委員が当該委員の意向を受けて,議決権を代行行使することは許容した。専門委員も自身のCOI を提出するが,議決権の代行行使に際しては当該委員のCOI が代理専門委員に適用されることにした。
  11. 委員と専門委員で構成される改訂委員会にてAbstract Table(図2)がまず提示され,エビデンス総体のレベルと益と害のバランスにつき,評価した(図1)。次に推奨草案について,必要に応じて文言を修正したのち,推奨の程度が上記の手順に沿って,決定された。
  12. 治療アルゴリズムの治療選択肢の取扱い:第5 版ではこれまでと異なり,治療アルゴリズムの治療選択肢の決定法を事前に規定した。各治療法の有効性についてはそれに関するCQ で上記4 つのカテゴリーの推奨度により評価することとし,治療アルゴリズムに掲載する治療選択肢については,それぞれの腫瘍条件・肝機能条件のなかでエビデンスに加え,それ以外の社会的・経済的な要素も勘案し,推奨度の強い上位2 位までに絞ることにした。同率1 位もしくは同率2 位と考えられる場合はスラッシュにより表現した。
4.本文執筆
  1. 推奨決定会議の議論の内容は議事録に残し,できるだけ解説文に盛り込むこととし,主副担当で分担して対処した。
  2. 項目立てを統一し,記載内容を以下のように定義した。
    • • 背景:CQ の狙いのようなものを簡単に示す。
    • • サイエンティフィックステートメント:文献検索の過程から一次選択,二次選択の基準と結果,採用した論文の内容を簡単にまとめる。基本的に内容をそのまま記載し,解釈は加えない。事実のみを客観的に述べる。
    • • 解説:担当委員の解釈を加える。採用した論文でも推奨に生かすとは限らないので,どのような趣旨で生かしたのか,あるいは生かさなかったのかをできるだけ記載する。推奨決定会議の議論はここに反映させる。意見が分かれたなら,それも記載してよい。採用されなかった参考文献の引用も可能とした。推奨決定会議の投票結果も解説の末尾に記載することにした。
5.公聴会

2021 年6 月18 日,第57 回日本肝臓学会総会にて公聴会を開催した〔座長:徳重克年 東京女子医科大学消化器内科教授,平松直樹 大阪労災病院副院長兼消化器内科部長,吉治仁志 奈良県立医科大学消化器・代謝内科教授,長谷川潔 東京大学大学院肝胆膵外科学教授(改訂委員長)〕。

6.パブリックコメント

2021 年6 月7 日~7 月5 日の期間,日本肝臓学会ホームページに本稿および各アルゴリズム,各CQ とそれに対する推奨・本文を掲載し,パブリックコメントを公募した。その情報は日本肝臓学会と日本肝癌研究会のホームページに掲載するとともに,日本肝臓学会理事・評議員と日本肝癌研究会常任幹事・幹事に対し,それぞれの事務局からメールで周知した。

7.外部評価

佐野圭二帝京大学医学部外科学講座教授を委員長とした外部評価委員会(参照)を設置し,外部評価を実施していただいた。

■ 参考:エビデンスレベルの定義2)
生存・再発・発癌に関するエビデンス
  • ランダム化比較試験(RCT)はB,非ランダム化比較試験(NRS)はC からスタート。対照のないコホート研究はD。
  • 第III 相治験に代表される多施設かつ十分なサンプルサイズを備えているRCT はA にランクアップ。
  • 質の高い複数のRCT があり,合計サンプルサイズが十分であり,その結果が一貫している場合は,A にランクアップ。
  • 交絡が適切に調整されている複数のNRS があり,合計サンプルサイズが十分であり,その結果が一貫している場合は,B にランクアップ。
  • 交絡が適切に調整されているNRS で,十分なサンプルサイズがあり,効果が大きい場合は1 ランクアップ。
  • 生存が望ましいアウトカムである場合に,再発のみが利用可能なアウトカムである場合など,アウトカムが非直接的な場合は,1 ランクダウン。
A:強いエビデンスの例
  1. 十分な規模と質を備えた第III 相RCT の結果がある。
  2. 1 の基準は満たさないが(第II 相試験や症例計算がされていないような試験),複数のRCT があり,合計サンプルサイズが十分で,一貫した結果が示されている。
B:中等度のエビデンスの例
  1. RCT のメタアナリシスで有意な効果が示されているが,一貫性に乏しい。
  2. 非直接的なアウトカムに関して,RCT のメタアナリシスで一貫した有意な効果が示されている。
  3. バイアスを適切に調整したNRS が複数報告されており,一貫した結果がある。
C:弱いエビデンスの例
  1. 質の高くないRCT が1 報のみ報告されており,有意な結果を示している。
  2. 非直接的なアウトカムに関して,RCT のメタアナリシスで有意な結果が示されているが,一貫性に乏しい。
  3. バイアスが適切に調整されていないNRS が複数報告されており,一貫した結果がある。
D:非常に弱いエビデンスの例

A からC を満たさないもの。

診断に関するエビデンス
  • 適切な患者群が設定されており,妥当な参照基準(reference standard)に基づいて,指標検査(=検討対象となる検査,index test)の感度・特異度が報告されている場合にA からスタート。
  • 参照検査がすべての患者に一律に適応されていない場合,1 ランクダウン。
  • 参照基準が,理想的なものではなく他の代替指標である場合,1 ランクダウン。
  • 対象集団が,CQ で想定された集団と異なる場合に1 ランクダウン。
  • 真陽性だった場合に患者にとって重要なアウトカムに与える影響が少ない(早期癌の診断の生存に与える影響など)場合,1 ランクダウン。
A:強いエビデンスの例
  1. 適切に選択されたすべての対象者に対して,指標検査および参照検査が行われており,感度,特異度が報告されている。
  2. 上記基準を満たす複数の研究があり,研究結果が一貫している。
B:中等度のエビデンスの例
  1. A のエビデンスと比較して,参照検査がすべての対象者に行われていない。
  2. A のエビデンスと比較して,指標検査陽性例のみに参照検査が行われている。
  3. 複数の研究の結果に非一貫性がみられる。
C:弱いエビデンスの例
  1. B のエビデンスと比較して,患者集団がCQ で想定された集団と異なる。
  2. B のエビデンスと比較して,真陽性結果がアウトカムに与える影響が少ない。
  3. 感度のみが報告されている研究。
D:非常に弱いエビデンスの例

A からC を満たさないもの。

予後(ベースラインリスク)に関するエビデンス
  • 目的とするアウトカム(発癌,死亡)を縦断的にみたコホート研究をA としてスタート。
  • 研究に重大な限界(不適切な患者選択,不十分な経過観察,研究間の非一貫性,アウトカムの非直接性,サンプルサイズに起因する不精確さ,出版バイアスなど)が存在する場合,1 ランクダウン。
A:強いエビデンスの例
  1. 目的とするアウトカムに関して十分なイベント数を備えた縦断研究で,経過観察率が高く,患者選択基準が想定するシナリオに合致している。
  2. 複数の一貫した結果を示している縦断研究のメタアナリシスで,研究に重大なバイアスが認められない。
B:中等度のエビデンスの例
  1. 十分なイベント数を備えた縦断研究であるが,バイアス,非直接性,不精確さなどの点で限界を有している。
  2. 目的とするアウトカムに対して複数の研究を統合したメタアナリシスがあるが,研究デザイン上のバイアス,非一貫性,非直接性,不精確さ,出版バイアスが1 つ存在する。
C:弱いエビデンスの例
  1. イベント数が不十分な縦断研究。
  2. イベント数が十分な縦断研究であるが,2 つ以上の限界を有している。
  3. 複数の研究を統合したメタアナリシスがあるが,研究デザイン上のバイアス,非一貫性,非直接性,不精確さ,出版バイアスが2 つ存在する。
D:非常に弱いエビデンスの例

A からC を満たさないもの。

参考文献

1)
小島原典子,中山健夫,森實敏夫 他編.Minds 診療ガイドライン作成マニュアル2017.公益財団法人日本医療機能評価機構,2017.
2)
相原守夫.診療ガイドラインのためのGRADE システム第3 版.中外医学社,2018.