超軽量深層学習により少数症例で肺がん診断支援AIを開発

2025年3月27日公開

GPUサーバ無しで学習、ラップトップで推論できるエッジAI

プレスリリース研究情報通信数理・計算科学医工学

ポイント

GPUサーバ無しで学習でき、ラップトップで推論可能な超軽量AIモデルを開発。
AIの低コスト開発・運用を実現し、希少疾患のためのAI応用の進展に期待。

概要

東京科学大学（Science Tokyo）^※ 総合研究院バイオメディカルAI研究ユニットの鈴木賢治教授らの研究チームは、計算に要する負荷が極めて軽く、AI学習に必須とされてきたGPUサーバを使わなくても学習でき、ラップトップで推論可能な超軽量AIモデルの開発に成功し、本モデルを肺がん診断支援AIへ応用した研究を、臨床系医用画像分野のトップカンファレンスである第110回北米放射線学会（RSNA2024）で発表しました。

本モデルは、画像全体を画像毎に学習する従来の大規模モデルと異なり、画像から取り出した無数の画素毎に学習することで、学習データ量（画像数や症例数）とモデル規模を最小化しました。本モデルを肺がん診断支援AIへ応用し、モデル構築に必要な症例数を、通常の何千症例から僅か68症例に抑えることに成功し、最先端モデルを凌駕する性能を達成しました。本モデルは最先端モデルの2千〜2万分の１の規模しかなく、MacBook Air (M1チップ)でも、8分20秒で学習が終了し、一症例あたりの推論時間も47ミリ秒と一瞬の時間となりました。本モデルを活用することで、高価な大規模GPUサーバや大量の症例収集無しでAI開発が可能となり、AIの低コスト開発、低コスト運用が実現されます。また、大量の症例が収集できないため開発が不可能とされていた希少疾患向けAIへの応用の扉を開く成果と言えます。

本研究は、東京科学大学工学院情報通信系の小寺昇冴修士課程学生、Chavoshian Seyed Mohammad（チァボシアン・セイエッド・モハマド）修士課程学生、総合研究院バイオメディカルAI研究ユニットのZe Jin（ゼ・ジン）助教、鈴木賢治教授、東京大学大学院医学系研究科放射線医学講座の阿部修教授、渡谷岳行准教授（研究当時。現在は国立国際医療研究センター病院所属）によって行われ、2024年12月4日にRSNA2024にて発表されました。本研究の先端的成果が評価され、Cum Laude賞（1,312件の発表件数中、1.45%が受賞）を受賞しました。

2024年10月1日に東京医科歯科大学と東京工業大学が統合し、東京科学大学（Science Tokyo）となりました。

背景

深層学習モデルに基づく人工知能（AI: Artificial Intelligence）が様々な製品やサービスに応用され、革新的な進歩をもたらしています。例えば、深層学習に100万枚の画像といった大量のデータ、すなわちビッグデータを学習させれば、従来技術を凌駕する性能や人の能力を超える性能を獲得できることが報告されています。また、近年、深層学習モデルの大規模化が進んでおり、2012年発表のAlexNetモデルで扱うことのできるパラメータ数は600万であったのに対し、2023年のViT-22Bビジョントランスフォーマーモデルは220億ものパラメータを有します。

深層学習モデルの発展や活用が進められる中、課題も少なくありません。例えば、ビッグデータはどのような分野やタスクでも得られるわけではなく、特に医療分野では、数百の症例画像などを収集するだけでも数年単位の期間を要します。更には、データに正解ラベルを医師が手作業で付ける、アノテーション作業に膨大な時間が必要です。また、大量のモデルを学習するためには、数百万円から数千万円の導入コストを要する大規模なGPUサーバが必須であり、モデル学習には数日から数週間の期間を要します。また、学習後のモデルにより推論を実行する際も大規模GPUサーバが必要です。十分な性能を持つ深層学習モデルを獲得するには、数十回〜数百回もの試行錯誤が必要であり、モデル完成までに数ヶ月から数年という長い時間を要することが課題とされています。それに伴う電力消費も深刻な問題として取り上げられつつあります。

このように、現在の深層学習モデルでは、大量データの収集、膨大なアノテーション作業、高価なGPUサーバの導入と長期の開発期間が深刻な課題とされています。これらの課題を解決するため、鈴木賢治教授らの研究チームは、深層学習に必須のGPUサーバ無しで学習でき、ラップトップで推論可能な超軽量深層学習モデルの研究開発に取り組み、同超軽量モデルの肺がん診断支援AIへの応用を試みました。

研究成果

本研究は、比較的少数のデータで、GPUサーバを使わなくても学習ができる小規模な深層学習モデルを開発することに取り組んだもので、鈴木教授の研究室で長年開発、改良を続けている独自の深層学習モデルであるMassive-training artificial neural network (MTANN）^[用語1]の少数データ学習性に着目した研究です。私ども独自のMTANNモデルは、画像全体を画像毎に学習する従来の大規模モデルと異なり、画像から取り出した無数の画素毎に大規模学習することで、学習データ量（症例数）とモデル自体の規模を最小化することに成功したモデルです（図１）。MTANNモデルのパラメータ数は数万個程度であり、近年の大規模モデルに比べて３桁以上少ないパラメータ数でモデルを構築できます。このため、計算量も極めて少なく、超短時間での学習と推論が可能です。

今回の研究では、肺のコンピュータ断層撮影（CT）画像の中から良性と悪性の結節（肺がんの可能性のある病変）の画像を本MTANNモデルに学習させ、結節を見分け肺がん診断支援AIを構築する実験を行いました。通常、医療向けのAI開発には何千症例もの画像データが必要ですが、100症例以下での少数学習を実証するため、米国の多施設で収集されたLIDC-IDRI^[用語2]データベースを用い、その中から68症例の肺結節画像をMTANNに学習させた後、616症例の肺結節の画像を用いて良性・悪性の判別テストを行い、判別精度を検討しました。

判別性能については、世界的に広く使われている最先端深層学習モデル（Vision Transformer、3D ResNetに転移学習を適用）と本MTANNモデル（スクラッチから学習）を比較しました。モデルの判別性能を示す指標であるROC曲線下面積（AUC；値が高いほど判別性能が高いことを示す）を用いて評価したところ、2種類の最先端深層学習モデルの性能（AUC=0.53、0.59）を凌駕する性能（AUC=0.92）を達成しました。医療領域のAIモデル学習に必要な症例数は千〜数千症例が必要と言われてきましたが、このように本研究では僅か68症例に抑えることに成功しました。

本MTANNモデルは最先端モデルの2千〜2万分の１の規模しかなく、他の深層学習モデルの学習・推論にはGPUサーバが必要ですが、本MTANNはラップトップでも実行可能であることも大きな特徴です。モデルの規模が比較的小さい3D ResNetの10分割交差検証の学習がGPUサーバでも31分かかったのに対し、MTANNの学習はMacBook Air (M1チップ)で8分20秒で終了し、一症例あたりの推論時間も47ミリ秒とごく短時間で完了しました（図２）。このように、本MTANNモデルが超軽量で計算効率が極めて高いことを確認しました。

表1 超軽量MTANN深層学習モデルと他のモデルとの学習時間と推論時間の比較
モデル	パラメータ数	学習時間 (68症例)	推論時間 (1症例当り)	性能 (AUC)	実装コンピュータ
3D ResNet	46M	31分21秒	76ミリ秒	0.59	GPUサーバ (NVIDIA, Quadro GV100)
3D MTANN	0.017M	8分20秒	47ミリ秒	0.92	MacBook Air (Apple, M1チップ)

社会的インパクト

本研究で開発した独自の超軽量MTANNモデルを使えば、高価な大規模GPUサーバの導入や大量の症例収集を行わなくてもAI開発が可能となり、AIの低コスト開発が実現すると考えられます。資金が潤沢な外国企業が圧倒的に優位であったAI開発を、国内の中小・スタートアップ企業でも十分に担えるようになることで、AI開発の産業構造が大きく変わる可能性があります。さらには、GPUサーバを使わずデバイス上で直接推論をするエッジAI、ラップトップでの低コスト運用も実現するため、あらゆる場所で誰もが身近にAIを利活用できるようになることも期待できます。今回着目した医療分野では、診断を支援するAIを、大病院のみならず中小病院や開業医でも気軽に利用できるようになると考えられます。

今後の展開

鈴木教授らの研究チームによる超軽量深層学習モデルの開発の成功は、大量の症例が収集できないため開発が不可能とされていた希少疾患のためのAIへの応用の扉を開く成果と言えます。現在医療AIの製品化は、主要な疾患に集中しており、そのカバー領域から外れた疾患を持つ患者は、このAI活用の恩恵を受けられていません。あらゆる疾患を対象とする医療AIを低コスト・省リソースで開発可能という本MTANNの特徴を活かし、世界中の病気を持つ患者に対して、病変の早期発見、早期治療を促し、多くの患者を救う医療AIを今後開発していきたいと考えています。また、医療以外の分野においても、大量のデータが得られないためAI開発・応用が進んでいない領域に対する様々なAI開発に注力していく予定です。

付記

科学技術振興機構未来社会創造事業「サイバー世界とフィジカル世界を結ぶモデリングとAI」（JPMJMI20B8）

用語説明

[用語1]: Massive-training artificial neural network（MTANN）：大規模学習ニューラルネット。鈴木教授が発明し改良を続けている最初期の深層学習モデルの１つ。医療画像以外の画像に対しても適用可能で汎用的なモデル。判別、認識、検出の他に、セグメンテーション、パターン強調、画像処理など様々なタスクを行うことができる。
[用語2]: LIDC-IDRI：The Lung Image Database Consortium - Image Database Resource Initiative：米国の多施設で収集された肺がん症例を含むCTのパブリックデータベース

学会情報

学会：: 110th Scientific Assembly & Annual Meeting of the Radiological Society of North America (RSNA)
タイトル：: Super-Efficient AI for Lung Nodule Classification in CT Based on Small-Data Massive-Training Artificial Neural Network (MTANN)
研究者：: Kodera S., Chavoshian S. M., Jin Z., Watadani T., Abe O., and Suzuki K.

研究者プロフィール

鈴木賢治（スズキケンジ） Kenji Suzuki

東京科学大学総合研究院バイオメディカルAI研究ユニット　教授
研究分野：機械・深層学習、人工知能（AI）、AI支援診断、医用画像認識、医用画像処理

お問い合わせ

東京科学大学総合研究院バイオメディカルAI研究ユニット

教授鈴木賢治

Tel: 045-924-5028
Fax: 045-924-5303
Email: info@bmai.iir.isct.ac.jp

取材申込み

東京科学大学総務企画部広報課

Tel: 03-5734-2975
Fax: 03-5734-3661
Email: media@adm.isct.ac.jp

ニュース＆イベント