2024年3月29日
日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:島田 明、以下「NTT」)は、AI・機械学習分野の難関国際会議NeurIPS2023の併設ワークショップで初の連合学習技術に関するコンペティションとして開始された、"Privacy Preserving Federated Learning Document Visual Question Answering※1"(以下、PFLベンチマーク)で歴代最高性能を達成しました。PFLベンチマークは、現在も投稿可能であり、最新のベンチマークの結果が公表されています。
連合学習とは、複数の組織で保持しているデータを一か所に集約せずに、組織横断のAIモデルを学習させることを可能にする技術です。機微な情報が含まれるようなデータでは、組織の外にデータを持ち出すことが難しいため、連合学習は解決策の一つとして注目されています。PFLベンチマークでは、機微情報を含むような文書(請求書や業務マニュアル等)をAI学習の対象として、それらの文書に対するQ&Aチャットボットを実現できるような優れたAIモデルを目指して精度を競います。加えて、連合学習の過程で機微情報が保護されていることの指標として差分プライバシー※2が定められており、差分プライバシー※2が用いられており、厳しいプライバシー保護の条件下で精度を競います。
NTTでは、かねてから差分プライバシーに基づく安全性と精度を両立する連合学習技術の研究開発を積極的に行っており、高い精度を実現するアルゴリズムを開発してきました※3。深見匠研究員、山﨑雄輔社員、張一凡主任研究員、丹羽健太特別研究員がPFLベンチマークに取り組み、NTTの連合学習アルゴリズムを改良して歴代最高性能を達成しました。
NTT は、情報の保護と活用を両立する技術として期待される連合学習技術の開発を通じて、組織横断的に分散蓄積されるデータの利活用の促進に貢献し、NTTが推進するIOWN PETs※4機能として実用化することを目指します。
※1Privacy Preserving Federated Learning Document Visual Question Answering : AI・機械学習分野の難関国際会議NeurIPS2023併設ワークショップで開催された連合学習に関するコンペティションであり、連合学習の安全性に関する初のオープンベンチマークとして継続的に更新されているプロジェクト
https://neurips.cc/virtual/2023/competition/66580
https://benchmarks.elsa-ai.eu/?ch=2&com=evaluation&task=2
※2差分プライバシー :データの特性に依存しない統計解析の安全性を保証できることを目的として提案されたデータプライバシ保護の強度を定量的に測る指標。なお、米国国勢調査においても、「差分プライバシー」を用いた保護手法が採用されています。
※3I. Tyou, T. Murata, T. Fukami, Y. Takezawa, and K. Niwa, "A localized primal-dual method for centralized/decentralized federated learning robust to data heterogeneity," in IEEE TSIPN, 2023.
https://ieeexplore.ieee.org/abstract/document/10373878
※4IOWN PETs(IOWN Privacy Enhancing Technologies) IOWN時代における自由で活発なデータ連携を実現するため、データが生成されてから消滅するまでのライフサイクルを通じて、データ所有者のポリシーの範囲内でのみ利用されることを技術的に保証し、安全なデータ流通を可能とする平文のない世界を創ることを目指す取り組み
https://www.rd.ntt/sil/project/iown-pets/iown-pets.html
本件に関する報道機関からのお問い合わせ先
日本電信電話株式会社
サービスイノベーション総合研究所
企画部 広報担当
nttrd-pr@ml.ntt.com
トピックスに記載している情報は、発表日時点のものです。
現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。
NTTとともに未来を考えるWEBメディアです。