検索パネルを開く 検索パネルを閉じる メニューを開く メニューを閉じる

2015年1月21日

自然な音声対話が可能な「接客型デジタルサイネージ」を開発 ~能動的かつインタラクティブな情報提供を実現~

日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:鵜浦博夫、以下NTT)とピーディーシー株式会社(本社:東京都港区、代表取締役社長:菅原 淳之、以下PDC)は、自然な音声対話が可能な「接客型デジタルサイネージ」を開発しました。
 今回開発した「接客型デジタルサイネージ」は、ユーザが情報検索をするとき、従来のようにタッチパネルを何度もタッチする必要がなく、ユーザの発話から単語の組み合わせなど分析し、ユーザの要望する情報を検索・提示するシステムです。また、100dBの騒音下でも対話が可能です。

今回、NTTとPDCでは、開発した「接客型デジタルサイネージ」のコンセプトの展示およびデモンストレーションを、2015年1月21日(水)~1月23日(金)にパシフィコ横浜で開催される日本ショッピングセンター全国大会「SCビジネスフェア2015」(http://www.jcsc.or.jp/event/bf2015/index.html (別ウインドウが開きます))にて実施いたします。

今後、NTTとPDCでは、NTTの研究所が持つ自然な音声対話を可能とする技術、および、あらゆる騒音環境下で目的の音声をクリアに集音できるインテリジェントマイク技術と、デジタルサイネージ分野において国内で高いシェアを持つPDCのノウハウを活かし、能動的かつインタラクティブな情報提供を可能とする「接客型デジタルサイネージ」の実現を目指してまいります。

今後の展開について

商業施設や公共交通機関などのデジタルサイネージ導入事業者さまに対して、上記の展示会などを通じて、コンセプトやユーザインタフェースデザインのフィージビリティを調査し、状況に応じた対話技術のチューニングなどを行い、今後、NTTグループ会社を通じて「接客型デジタルサイネージ」のビジネス化を推進してまいります。
 また、今後、訪日外国人などへの対応を図るため、接客型デジタルサイネージの多言語対応を行なう予定です。

1.背景

従来のデジタルサイネージシステムでは、ユーザが情報を得るためのインタフェースとしては、「タッチパネル」操作が主流ですが、大規模な商業施設や駅など広範囲に多数の店舗を抱える施設においては、提示する情報が多岐にわたるため、ユーザが求める情報にたどりつくには、何度もタッチパネルをタッチする操作が必要となり、大きな手間となっています。
 また、音声認識を用いて案内を行うシステムでは、一問一答方式であるため、込み入った内容の検索を行うことができず、また、設置場所が高騒音な環境であるため誤認識や再発声が必要となるなど、使い勝手が良いものではありませんでした。

2.取り組みの狙い

NTTは、研究所が持つ世界トップレベルの音響処理・音声認識・言語処理・音声合成をはじめとしたメディア関連技術を活用し、システムがあらゆる騒音環境下で音声を認識して自然な音声対話を行い、ユーザの様々なニーズに応える「音声対話プラットフォーム技術」の研究開発に取り組んでいます。
 また、PDCは、昨今、商業施設や公共交通機関などを中心に、国内で急速に普及が進んでいるデジタルサイネージ市場において、大型施設でのシステム導入数のトップシェアを持っており、今後、東京オリンピック・パラリンピックが開催される2020年に向けて、さらなる普及・拡大と競争力の強化を狙って、より幅広いユーザが使いやすいユーザインタフェースを持つデジタルサイネージシステムの実現を推進しています。
 今回両社は、NTTが持つ研究開発成果と、PDCが持つデジタルサイネージシステムおよびデジタルサイネージに関するノウハウを組み合わせ、デジタルサイネージにおいて、「接客型」という新しい価値を提供することを目指します。

3.「接客型デジタルサイネージ」における技術のポイント

(1)ユーザの意図や状況をわきまえた受け答え

接客型デジタルサイネージは、ユーザに能動的に話しかけ、ユーザが通常に人と話すような言葉で発した要望を解釈し、ユーザが置かれた状況に応じてインタラクティブな情報提示を行うことで、自然な対話を可能とします。
 また、外部情報(API)と連携することにより、商業施設や駅などで、様々な情報の提示を可能とします。
 (例:商業施設内のレストランの待ち時間情報の提示、目的地に最初に到達する電車の情報など)

<1> クイックレスポンスでダイレクトな情報提示
「トイレはどこですか」のような質問は、すぐに最寄りのトイレに行きたいというユーザの意図を理解し、クイックレスポンスでダイレクトに情報を提示します。

<2> 対話聞き取りによる適切な情報提示
「レストランを探しています」のような質問は、システムから能動的に「レストランのジャンルを教えてください」などと自然な言葉で発話しながら、ユーザとの対話聞き取りを通じて、要望する情報を検索、提示します。

<3> 状況判断による情報の取捨選択
「閉館時間は何時ですか」のような質問は、ユーザが置かれた状況(来店した日時など)に応じて、「本日は木曜日なので、19時に閉店です」などと状況判断を行い、情報を提示します。

<4> 旬の情報提示
お店が提供したい旬のおすすめ情報(例:今週限定の旬な素材を使ったランチメニューの情報)など、今週だけ、この時間帯だけといった旬な情報を提示します。

(2)騒がしい環境下でもユーザの音声を認識

NTTが開発したあらゆる騒音環境下で目的の音声をクリアに集音可能とする「インテリジェントマイク技術」を組み合わせることで、ショッピングセンターのような騒がしい環境下でもユーザの音声を認識することが可能となります。一般的な駅や商業施設の騒音レベルは60~80dBであり、NTTのインテリジェントマイク技術を用いると、これら騒音環境下でも、音声認識が可能です。

(3)システム作成者におけるコスト削減メリット

詳細な粒度の固有表現を獲得する固有表現抽出技術※1、および、低コストで作成可能な学習データに基づくタスク判定技術※2の活用により、これまでと同じ対話のシナリオを作成する場合には、対話ルール数の削減(従来に比べて約50%削減)が実現できます。

用語解説

※1固有表現抽出技術
人名、地名、組織名等(固有表現)を単語列から抽出し、そのカテゴリを推定する技術。対話ルールを単語でなく、固有表現カテゴリで記述することでルールの抽象度を高めることができます。

※2タスク判定技術
音声対話エージェントに対するユーザの発話内容から、ユーザがどのような情報を求めているのかを推定する技術。

コンセプト・イメージ

コンセプト・イメージ

<参考1>ピーディーシー株式会社について

ピーディーシー株式会社は、2001年10月、パナソニック株式会社の社内ベンチャー制度第1期で、「大型ディスプレイ向け映像コンテンツ制作・配信・運営管理」の専門会社として誕生しました。現在、株式会社ドコモ・ベンチャーズが19.2%の出資をおこなっています。設立以来、業界最高レベルの顧客様のシステム構築とコンテンツ提供を行ない、また、映像システムの構築から、コンテンツ制作、配信管理、顧客情報分析までトータルソリューションを提供しています。

<参考2>デジタルサイネージの現況

国内のデジタルサイネージ市場は、年々拡大の一途をたどっており、2012年には約822億円、2020年度には2,520億円市場へ成長すると見込まれている。当初、駅や車両の運行情報や金融機関の金利情報の表示に活用されたが、全体の低コスト化につれて、幅広く需要層が広がり、表示内容も情報告知から販促/空間演出、広告など多様な展開を見せている。( http://www.fcr.co.jp/pr/13037.html (別ウインドウが開きます)

本件に関するお問い合わせ先

日本電信電話株式会社
サービスイノベーション総合研究所
企画部広報担当
TEL:046-859-2032
E-mail:randd@lab.ntt.co.jp

Innovative R&D by NTT
NTTのR&D活動を「ロゴ」として表現しました



ピーディーシー株式会社
管理部広報担当
TEL:03-5575-2455
E-mail:info@pdc-pana.co.jp

ニュースリリースに記載している情報は、発表日時点のものです。
現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。