助成事業

【調査研究助成】同志社大学 井本 桂右准教授の研究報告サマリーをご紹介します

【研究者】
同志社大学 理工学部 井本 桂右 准教授

【研究テーマ】
複数の汎用型音響センサによるシーン分析

【研究助成期間】
2018.4.1~2021.3.31


【研究サマリー】

人の声に限らないあらゆる音を分析し、発生した音の種類や音が収録された場所、周囲の人の行動を分析する技術は「環境音分析」と呼ばれている。スマートフォンや情報家電に搭載された複数の音響センサを同時に活用することで、音源の位置情報や音の広がり具合といった空間情報を抽出できることから、高度な環境音分析技術の実現が期待できる。しかしながら、汎用の音響センサを用いる場合、雑音の混入や音響センサの故障による観測の欠損が頻繁に発生し、分析性能が大幅に劣化するという問題があった。

本研究課題では、雑音の混入や音響センサの故障が発生した場合においても高性能に環境音を分析できる手法を検討し、(i)多数の汎用音響センサにより収録された環境音データセットを構築した。また,(ii)雑音の混入に対しても頑健に環境音分析可能なゲート機構付き深層学習法を提案し、雑音が混入しない環境と同程度の分析性能を実現した。さらに、(iii)音響センサの故障により一部の観測が欠損した場合でも頑健に環境音分析が可能な手法として、事前に音の欠損をシミュレーションしてデータ拡張を行う手法を提案した。


【本助成研究にかかわる成果】
Keisuke Imoto and Nobutaka Ono, “RU Multichannel Domestic Acoustic Scenes 2019: A Multichannel Dataset Recorded by Distributed Microphones with Various Properties,” Proc. Detection and Classification of Acoustic Scenes and Events (DCASE) Workshop, pp. 104-108, 2019.

Yuki Okamoto, Keisuke Imoto, Naoki Tsukahara, Ken Nagata, Koh Sueda, Ryosuke Yamanishi, and Yoichi Yamashita, “Crow Call Detection Using Gated Convolutional Recurrent Neural Network,” Proc. RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP), pp. 171-174, 2020.

井本 桂右, 塚原 直樹, 永田 健, 末田 航, “ゲート付き畳み込みリカレントニューラルネットワークを用いたカラスの鳴き声の自動検出,” 日本音響学会誌, 75巻 10号, pp. 559-567, 2019.

Keisuke Imoto, “Acoustic Scene Classification Using Multichannel Observation with Partially Missing Channels,” Proc. European Signal Processing Conference (EUSIPCO), 2021.


【本助成についての感想】
企業から大学に籍を移したばかりのスタートアップ期間に本調査研究助成に採択頂き、円滑に研究活動を開始することができました。ご支援誠にありがとうございました。