NTTのAI技術corevo SXSW2017 Featured SessionとJAPAN FACTORYにてデモンストレーションを実施

米国テキサス州オースティン市で行なわれる、音楽・映画・インタラクティブをテーマとする世界最大規模のビジネスとコンテンツの祭典SXSW2017（サウス・バイ・サウスウエスト2017）［会期：2017年3月10日～19日］において、弊社NTTコミュニケーション科学基礎研究所とNTTメディアインテリジェンス研究所のメンバーが、共同研究を行っている大阪大学石黒研究室と共に、議論対話システムの展示を行いました。

議論対話システムは、ユーザと複数の話題についてディスカッションができるシステムで、以下に説明するNTTのAI技術corevo^※1が結集されています。SXSW2017におけるInteractive分野で会期中1,300を超えるSessionのうち、注目すべきSession として選ばれるFeatured Session^※2の中で、デモンストレーションを披露しました。また、JAPAN FACTORYにおける展示では、13,000人を超える来場者にデモンストレーションを見ていただいたほか、一部の方には実際に議論対話を体験していただきました。これらの展示は、現地でも大変話題となり、24ものWEBメディアに取り上げられたほか、USA TODAYや地元紙にも写真付きで紹介されました。

なお、本議論対話システムは2017年6月1日・2日に開催される、NTTコミュニケーション科学基礎研究所オープンハウス2017^※3にて展示されます。

SXSW2017 Featured Sessionでの様子

JAPAN FACTORYでの様子

技術内容

○耐騒音集音技術

騒がしい展示会場にて、ロボットから離れて話しても音声認識するための集音技術を搭載しました。ここでは、「インテリジェントマイク技術」を使用し、目的音の劣化を抑えつつ、周囲雑音のパワーを低減させることで、目的音のクリアな集音を可能としています。
（担当：伊藤弘章研究員、荒木章子主任研究員、原田登主幹研究員、澤田宏主幹研究員）

○音声認識・音声合成技術

深層学習に基づく音声認識技術により、ユーザのラフな発話も高精度に認識し、システムとのスムーズな議論対話を実現しました。また、音声合成技術は、話者（声質）と話し方（抑揚）を組み合わせることで、表現力豊かにロボットに合った多様な合成音声を生成しています。
（担当：福冨隆朗研究主任、井島勇祐研究員、松井清彰社員）

○議論対話技術

議論を行うためには、システムは一貫した主張を持った上で、論拠の提示やユーザ主張への反論をする必要があります。本技術では、特定の話題について議論をするために構築された議論構造に基づき、議論の状況を適切に管理することで、議論を展開しています。
（担当：東中竜一郎主任研究員、杉山弘晃研究員、成松宏美研究員）

^※1 「corevo」は日本電信電話株式会社の商標です。