2017年2月 3日
日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:鵜浦 博夫、以下 NTT)は、NTTグループのAI技術(corevo™)の一つとして、東京大学大学院医学系研究科医療情報学分野、東京大学医学部附属病院企画情報運営部 大江和彦教授らの研究グループ(以下 東大)と共同で、約900名の糖尿病患者の電子カルテデータを利用して、糖尿病患者の症状が悪化する原因の一つである患者行動「受診中断」を予測するモデル(図1)を世界に先駆けて構築しました。本モデルは患者行動に関連のある特徴量をもとに機械学習技術で構築し、受診中断を7割の精度で予測します。従来の研究では受診中断の要因が検討され、受診中断者の性別や年齢等の傾向は明らかにされていましたが、本モデルは積極的に支援すべき中断リスクの高い患者を個人の電子カルテデータを用いて抽出できるため、医師による患者への効率的な介入を支援することが可能となります。
本モデルの構築は、東大COI拠点(自分で守る健康社会 ~Self-Managing Healthy Society COI拠点~)における共同研究として実施しました。本モデルは、電子カルテデータの標準規格SS-MIX2*1標準化ストレージに準拠しているため他病院への展開が可能であり、2017年度から複数病院のSS-MIX2データから構築されたデータベース*2での評価試験を開始します。
糖尿病の患者数は近年増加傾向にあり、2014年における糖尿病の患者数は316万人に達しています(平成26年患者調査(厚生労働省))。糖尿病は進行すると合併症等を引き起こし、QOLの低下や医療費の増大につながるため、糖尿病患者には治療の継続が求められています。しかし、糖尿病外来患者の約1割が受診を中断し、合併症の発症後、病態が悪化してから受診を再開するというケースが多いことが問題となっています。
従来研究では受診中断の因子を明らかにするため、属性や検査値から受診中断者の特徴に関する調査が行われています。年齢が低いことや男性の有職者といった特徴が報告されており、「糖尿病受診中断対策包括ガイド」として糖尿病治療に関わる医療従事者に周知・活用されています*3。しかし、受診中断には様々な要因が考えられるため、医師がここからさらに積極的に支援すべき患者を個人にまで絞り込み、支援することができずにいました。
そこでNTTと東大は、個人の電子カルテデータをもとに受診中断を予測するAIの構築を目指しました。予測精度を高めるため、東大の医療データ分析や臨床での患者への指導に関する知見を参考にして生成した特徴量とNTTがこれまで培ってきたAI技術「corevo™」における機械学習に関する知見をもとにモデルを構築しました。本モデルは、電子カルテデータやそこから生成された特徴量を入力して予約不履行(受診が途絶えるきっかけとなり得る予約外来の不受診)と受診中断リスク順位(将来の受診中断日までの日数の長さによる患者の順位付け)の2つを予測します。本モデルを2011年から2014年にかけて東京大学医学部附属病院に糖尿病の治療で通院している患者約900名の電子カルテデータを用いて評価したところ、優れた予測性能(予約不履行はAUC*4=0.958、F値*5=0.704、受診中断リスク順位は正解率*6=0.706)を確認しました。この精度(F値)は、本モデルが不受診となった予約のうちの7割を予測できていることを意味しています。また、新たに予約登録日*7や予約日*8の曜日、予約登録日と予約日の間隔など、これまで医師が気づかなかった患者の予約行動に関わる項目が予測に影響を与えていることもわかりました。予測結果をもとに、受診中断を避けるために積極的に支援すべき患者の絞りこみや、支援を開始すべき時期の見極め、支援の度合いの調整が可能となることから、医師の診療支援、ひいては患者の病態の維持・改善につながることが期待できます。
近年、電子カルテデータの標準規格SS-MIX2(2016年2月に厚生労働省が認定)が普及し、大量の診療情報をAIで利活用できる基盤が整いつつあります。本モデルは、このSS-MIX2標準化ストレージに準拠しているため他の病院への展開が可能です。対象データの規模拡大によって、より精緻な予測モデル構築が期待できることから、2017年度から複数病院データベースでの受診中断リスク予測の評価試験を開始します。
今後、NTTは医療・健康に関するエビデンスをベースに病態悪化の予兆を捉え、患者の予防・健康づくりに向けた行動変容を支援する研究開発に取り組み、患者のQOLの向上や医療費増加の抑制など社会課題の解決に貢献していきたいと考えています。そして、生活習慣病予備群や健康な状態にある人への健康支援にも積極的に取り組み、様々なICTサービスと連携しながら、健康社会の実現を目指していきたいと考えています。
なお本研究は東京大学大学院医学系研究科・医学部倫理委員会の承認を得て実施されています。
※「corevo」は日本電信電話株式会社の商標です。
※本成果は、2017年2月16日~17日に開催の「NTT R&Dフォーラム2017」にてご覧いただけます。
図1:予測モデル概要図
図2:入力データの例
表1:先行研究との比較表
*1厚生労働省電子的診療情報交換推進事業(SS-MIX:Standardized Structured Medical Information Exchange)において検討が進められてきた、電子カルテのデータを国際標準、厚生労働省標準のデータに変換し電子ファイルシステムとして格納する保管庫のこと。2015年3月末までに850の病院に導入されている。
*2日本医療研究開発機構(AMED)の臨床研究等 ICT 基盤構築研究事業「医用知能情報システム基盤の研究開発」(研究代表者:大江和彦)(H27~H30)により構築されました。
*3野田光彦, 山崎勝也, 林野泰明, 他:糖尿病受診中断対策包括ガイド, 2014.
*4AUC(Area under the curve):横軸を偽陽性率(1-特異度、FP/(FP+TN))、縦軸を真陽性率(感度、再現率、TP/(TP+FN))として予測結果を描いた曲線(ROC(Receiver operating characteristic)曲線)の下部面積のこと。完全にランダムな場合は0.5となる。一般に0.9以上のAUCは「優れた予測性能」と位置づけられている。
*5陽性的中率(適合率、TP/(TP+FP))と真陽性率(感度、再現率、TP/(TP+FN))の調和平均のこと。適合率と再現率は互いにトレードオフの関係
*6患者間での受診中断リスク値(将来の受診中断日までの日数の長さ)の大小関係の正解率((TP+TN)/(TP+TN+FP+FN))のこと。
*7外来予約を受け付けて登録した日のこと。
*8外来予約によって受診を予定した日のこと。
電子カルテデータ | |||
中断 | 継続 | ||
予測結果 | 中断 | TP | FP |
継続 | FN | TN |
本件に関するお問い合わせ先
日本電信電話株式会社
先端技術総合研究所 広報担当
a-info@lab.ntt.co.jp
TEL 046-240-5157
ニュースリリースに記載している情報は、発表日時点のものです。
現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。
NTTとともに未来を考えるWEBメディアです。