2017年5月30日
米国テキサス州オースティン市で行なわれる、音楽・映画・インタラクティブをテーマとする世界最大規模のビジネスとコンテンツの祭典SXSW2017(サウス・バイ・サウスウエスト2017)[会期:2017年3月10日~19日]において、弊社NTTコミュニケーション科学基礎研究所とNTTメディアインテリジェンス研究所のメンバーが、共同研究を行っている大阪大学 石黒研究室と共に、議論対話システムの展示を行いました。
議論対話システムは、ユーザと複数の話題についてディスカッションができるシステムで、以下に説明するNTTのAI技術corevo※1が結集されています。SXSW2017におけるInteractive分野で会期中1,300を超えるSessionのうち、注目すべきSession として選ばれるFeatured Session※2の中で、デモンストレーションを披露しました。また、JAPAN FACTORYにおける展示では、13,000人を超える来場者にデモンストレーションを見ていただいたほか、一部の方には実際に議論対話を体験していただきました。これらの展示は、現地でも大変話題となり、24ものWEBメディアに取り上げられたほか、USA TODAYや地元紙にも写真付きで紹介されました。
なお、本議論対話システムは2017年6月1日・2日に開催される、NTTコミュニケーション科学基礎研究所オープンハウス2017※3にて展示されます。
SXSW2017 Featured Sessionでの様子
JAPAN FACTORYでの様子
騒がしい展示会場にて、ロボットから離れて話しても音声認識するための集音技術を搭載しました。ここでは、「インテリジェントマイク技術」を使用し、目的音の劣化を抑えつつ、周囲雑音のパワーを低減させることで、目的音のクリアな集音を可能としています。
(担当:伊藤弘章 研究員、荒木章子 主任研究員、原田登 主幹研究員、澤田宏 主幹研究員)
深層学習に基づく音声認識技術により、ユーザのラフな発話も高精度に認識し、システムとのスムーズな議論対話を実現しました。また、音声合成技術は、話者(声質)と話し方(抑揚)を組み合わせることで、表現力豊かにロボットに合った多様な合成音声を生成しています。
(担当:福冨隆朗 研究主任、井島勇祐研究員、松井清彰 社員)
議論を行うためには、システムは一貫した主張を持った上で、論拠の提示やユーザ主張への反論をする必要があります。本技術では、特定の話題について議論をするために構築された議論構造に基づき、議論の状況を適切に管理することで、議論を展開しています。
(担当:東中竜一郎 主任研究員、杉山弘晃 研究員、成松宏美 研究員)
※1 「corevo」は日本電信電話株式会社の商標です。
※2 SXSW2017 Featured Session "Humans and Robots in a Free For All Discussion"(Youtube)
トピックスに記載している情報は、発表日時点のものです。
現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。
NTTとともに未来を考えるWEBメディアです。