検索パネルを開く 検索パネルを閉じる メニューを開く メニューを閉じる

2022年11月 9日

お知らせ

マルチメディア分野のトップカンファレンスACM MultimediaにてNTTコミュニケーション科学基礎研究所発表の論文がBest Paper候補(5件)にノミネートされました

2022年10月10~14日にポルトガルの首都リスボンのLisbon Congress Centerで開催された、マルチメディア分野の難関国際会議ACM Multimedia (ACM International Conference on Multimedia)2022において、NTTコミュニケーション科学基礎研究所より論文を口頭発表しました。なお本論文はBest Paper Award Candidatesに選ばれました(総投稿数2,472件のうち総採択数が691件であり(採択率27.9%)、そのうち口頭発表は146件(総採択数の21.1%)、Best Paper Award Candidatesは5件(総採択数の0.7%))。

発表論文は以下です。

■ ConceptBeam: Concept driven target speech extraction

大石 康智 主任研究員,デルクロア マーク 特別研究員,落合 翼 研究員,荒木 章子 主幹研究員,竹内 大起 社員,仁泉 大輔 リサーチスペシャリスト,木村 昭悟 主幹研究員,原田 登 上席特別研究員,柏野 邦夫 上席特別研究員

この論文では、音声や画像を用いて目的とする概念(意味内容)を指定すると、複数の声が混ざった音声の中から、その概念について話している話者の音声を分けて取り出すことができる、世界初の技術を発表しました。この技術は、複数人が同時に話す状況から、自身の聞きたい「話題」に注目し、その人の声に耳を傾けるAIへの応用が可能です。

NTTコミュニケーション科学基礎研究所は引き続き、人間と情報の本質に迫る基礎理論の構築と社会に変革をもたらす革新技術の創出をめざした基礎研究を推進します。

トピックスに記載している情報は、発表日時点のものです。
現時点では、発表日時点での情報と異なる場合がありますので、あらかじめご了承いただくとともに、ご注意をお願いいたします。