検索パネルを開く 検索パネルを閉じる メニューを開く メニューを閉じる

2023年5月30日

人と社会と地球を読み解けるヒントが満載!
NTTコミュニケーション科学基礎研究所
「オープンハウス2023」6月1日から2日間開催

2023年6月1日(木)~2日(金)、「オープンハウス2023」は大阪のQUINTBRIDGEで開催します。『多様な知と技術が彩る、だれもがどこでも輝ける未来』をコンセプトとし、講演や展示を通じて最新の研究成果などについてご紹介していきます。イベントに先駆けて、全16展示の中から5つの最新技術に焦点を当てて取り上げてまいります。

<全2回の前編/後編へ>

1)音そのものではなく、音の概念の理解に一歩踏み込んだ音声認識。興味のある話題に聞き耳を立てる、意味で音声を分離抽出する新しい信号処理技術Concept Beam

画像:音そのものではなく、音の概念の理解に一歩踏み込んだ音声認識。興味のある話題に聞き耳を立てる、意味で音声を分離抽出する新しい信号処理技術Concept Beam

報道発表資料
https://group.ntt/jp/newsrelease/2023/05/30/230530d.html

膨大な情報があふれる今の時代、効率的かつ迅速に必要な情報を取り出し、活用することが求められるようになっています。これまでインターネットの検索エンジンは、キーワードを入力することで、ナビなどでは音声認識で、画像であれば画像検索をすることで必要な情報を抽出してきました。しかし類似したものがある場合、本来抽出したいものとはまったく別のものが結果として出てきてしまうケースも多くありました。

しかし今回、ご紹介する概念フィルタ「Concept Beam」を活用すれば、データ自体に含まれる意味に合った内容かどうかを判定したうえで、結果を出すことが可能になります。

たとえば、4人のうち、2人が野球に関する話をしていて、残り2人が動物について話をしているとします。そこで「Concept Beam」で音声や画像、テキストいずれかで[野球]を意味するものをフィルタとして指定すれば、野球について会話している2人だけの情報を取り出すことができるようになるのです。

この技術は、既にあるさまざまな音声認識の前処理として使うことも可能です。この技術を通して、より内容がクリアな情報に変換された音声を使うと、既存の音声検索の精度をさらに上げることができます。

2)LLM(大規模言語モデル)のように大量のデータは不要。少ないデータから適切なテスト問題を提案。生徒それぞれに適度なレベルの問題の出題を実現。Monotonic VAEに基づいた個別最適な問題推薦手法

画像:2)LLM(大規模言語モデル)のように大量のデータは不要。少ないデータから適切なテスト問題を提案。生徒それぞれに適度なレベルの問題の出題を実現。Monotonic VAEに基づいた個別最適な問題推薦手法

GIGAスクール構想が掲げられ、学校のICT化が進められ、義務教育を行う小中学校では生徒一人あたり1台の端末が配布されています。ちなみに文部科学省では、人工知能(AI)技術を用いて、教育の負担軽減や一人ひとりの理解度に応じたテーラーメイド教育の実現を掲げています。

ここでご紹介するMonotonic VAEの技術を使えば、数多くの教材や問題の中から生徒一人ひとりに合った個別学習を行うことができるようになります。実はVariational AutoEncoder(以下VAE)はこれまでもあった技術ですが、従来のVAEでは膨大な教科書や問題集の中から最適な情報を取り出すことができても、少ない情報からは個別の最適学習を導き出すことができませんでした。最近メディアで話題になっているLLM(大規模言語モデル)は大量なデータを必要とするアプローチで、学校の現場ではそのデータ自体を集めるのも大変な状況です。そのため、Monotonic VAEのような少ないデータからのアプローチの方が使いやすいというわけです。今回、研究所が手がけたMonotonicVAEを活用し、生徒に100問ほどの問題に回答してもらえば、正解確率の予測が可能になります。

近い将来、生徒一人ひとりの学びのペースに合わせた個別最適学習が実現され、それぞれの能力をそれぞれのペースに合わせて引き出せるような日が来るはずです。

3)実は隣の人の会話が気になっていることもわかってしまう?細かな目の動きから心の動きを読み取る瞳孔・眼球運動に基づくマインドリーディング

画像:3)実は隣の人の会話が気になっていることもわかってしまう?細かな目の動きから心の動きを読み取る瞳孔・眼球運動に基づくマインドリーディング

報道発表資料
https://group.ntt/jp/newsrelease/2023/05/30/230530c.html

目の動きから人間の心の深いところまで読み解ける技術、アイメトリクス。その中で今回の技術は瞳孔の拡大や縮小に着目したものです。

たとえば、目の前にライブハウスの写真があるとします。右側は照明のあたった舞台、左側には暗めの客席があり、耳からは多くの観客たちでにぎわう客席の様子が聞こえてきます。やがて右側の舞台に歌い手が登場すると、歌が聞こえてきます。まずはその様子について自由に目線を動かして見てみます。そして次に目線を移動させず中央に固定させて見てみました。

この2つのパターンについて目線や瞳孔をデータで比較してみると、目線を中央に固定した場合でも、歌い手が舞台に登場したときには瞳孔の縮小によって、明るい方向に心が動いていることが判明しました。つまり、たとえ目線が動いていなくても、瞳孔の縮小具合で人の心が歌い手の方向に向いていることが分かっています。

既にアイトラッキング技術があり、心の動きや感情を読みとることはできるようになっていますが、このアイメトリクスの解析を進めることで、誰かと話しているときは、その相手を見ているけれど、実は隣で話している会話の方が、本当は気になっていてもっと聞きたいことがわかるなど、人がどこに注意を向いているかはもちろん、好きかどうかというような認知状態を予測することができるようになります。

さらに、音にこの技術を拡張していくと補聴器を着用している本人が、注目している方向の音を自動で無意識に大きくすることも可能です。今後この技術はさまざまな分野での活用が期待されます。

4)磁石の力で地球にやさしいディスプレイ。マグネシェイプ:磁気作動式ピンディスプレイ

画像:4)磁石の力で地球にやさしいディスプレイ。マグネシェイプ:磁気作動式ピンディスプレイ

報道発表資料
https://group.ntt/jp/newsrelease/2023/05/30/230530b.html

私たちの日々の暮らしは、電子機器によって支えられています。一方で、電子機器を活用することによって発生する二酸化炭素の排出は、地球規模での課題となっています。

ここでご紹介する磁気作動式ピンディスプレイは、マグネットシート、ピンを収めるハウジング、磁性ピンという手に入れやすくかつ安価な素材で作られているのが特徴です。市販の小型ポット磁石はサイズや形状、入手数が限られているうえ、1本1,000円です。一方で今回使用している磁性ピンは1円と安価であり、実用化が期待できます。

通常のピンディスプレイの場合、それぞれのピンを電気制御する必要があり、数百のモーターを準備する膨大なコストもかかり、さらに電気制御するための電力も必要になります。しかし磁気作動式ピンディスプレイでは、磁場パターンを書き込む技術を応用。電気を使うことなく、ピンを使ったディスプレイを実現することができるようになりました。

この技術を使えば、ハート型のような形はもちろん、文字を浮き出させることもでき、たとえば街でピンディスプレイを使った大胆な表現方法を使った広告を展開できるようになります。この技術はエコだけでなく、新たな表現ができるところが特徴です。

5)離れていても柔らかく触れる? 思いやりを感じることができるロボット操作を実現、遠隔操作ロボットにおける高追従低剛性制御

画像:5)離れていても柔らかく触れる? 思いやりを感じることができるロボット操作を実現、遠隔操作ロボットにおける高追従低剛性制御

これまでも工場では自動車や機器などを組み立てる際、産業用ロボットが導入され、より危険な仕事も人の代わりにロボットが行ってきました。ロボットの遠隔操作技術は、たとえば、医師がいない地方でも遠隔でロボットを操作することで手術ができたり、人が入れないような危険な環境下で作業をしたりする場合にも有効です。

従来の技術ではロボットが人の動きをトレースする形で動いていて、動きをピッタリ合わせると、動きが機敏すぎて物を破壊してしまったり、動きをゆっくりさせるようにすると、遅延が起きて操作がしにくかったりという課題がありましたが、今回新たに提案された方法では、人がモノを動かすときにかかる力をベースに縦、横、奥の3方向に対してどう動かそうとしているのか、という意図をくみ取り、予測したうえでそのデータをロボットに送信して動かしています。

常に人の動きをトレースしてロボットを動かす場合には常時の通信が必要です。しかし人の操作の意図をくみ取り、予測したデータをロボットに送って動かす手法では通信が不要であるため、従来にはなかったようなスムーズで柔らかい、より人間に近い動きが実現できるようになりました。

この技術を使えば、遠隔医療や人が入れない危険なエリアでの作業がもっとスムーズに行われるようになり、私たちの未来の安全・安心を支えることができる優しいロボットになります。

画像:5)離れていても柔らかく触れる? 思いやりを感じることができるロボット操作を実現、遠隔操作ロボットにおける高追従低剛性制御

「人と社会と地球を読み解く」という壮大な切り口をもとに、展開されるさまざまな取り組みが集結したオープンハウス2023。ぜひデモンストレーションを体験しながら、身近に迫る未来を体験してください。

「オープンハウス2023」開催場所:QUINTBRIDGE
〒534-0024 大阪府大阪市都島区東野田町4丁目15番82号 QUINTBRIDGE
JR大阪環状線「京橋駅」北口:徒歩約10分
京阪本線「京橋駅」西口:徒歩約10分
地下鉄長堀鶴見緑地線「京橋駅」:徒歩約5分
https://www.quintbridge.jp/about/#overview当該ページを別ウィンドウで開きます

現地会場へのご入場には、事前登録が必要となります。
こちらの「事前登録」からご登録ください。
NTT コミュニケーション科学基礎研究所 オープンハウス2023
https://www.kecl.ntt.co.jp/openhouse/2023/当該ページを別ウィンドウで開きます
ご来場が難しい場合は、オンラインでご参加ください。

2023/6/13 更新
人と社会と地球を読み解けるヒントが満載!
NTTコミュニケーション科学基礎研究所「オープンハウス2023」【ダイジェストレポート編】はこちら