Skip to content

KMASAHIRO/multichannel-soundfields

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

81 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

multichannel-soundfields

ニューラル音場推定による仮想音場でのマイクロフォンアレイ音源定位評価」のソースコードです。
多チャンネル音場推定(AVR/NAF)の学習・推論、シミュレーションデータ作成、実データの整形、評価までをまとめています。 実行方法の詳細は、各ディレクトリのREADME.mdに記載しています。


リポジトリ構成

multichannel-soundfields/
├ README.md          ドキュメント
├ LICENSE            ライセンスファイル(MIT License)
├ AVR/               音場推定手法:AVR(Acoustic Volume Rendering)
├ AcoustiX/          シミュレーション:AcoustiX(レイトレーシング)
├ NAF/               音場推定手法:NAF(Neural Acoustic Fields)
├ Pyroomacoustics/   シミュレーション:Pyroomacoustics(鏡像法)
├ metrics/           推定信号の評価
└ real_data/         実データのダウンロード・整形

データセット

実データのダウンロードと整形はreal_dataにまとめています。
シミュレーションデータはAcoustiX(レイトレーシング)とPyroomacoustics(鏡像法)で作成します。

ニューラルネットワークを用いた音場推定手法

多チャンネル音場推定の手法として、AVRNAFを用意しています。
AVRでは、AVRに多チャンネル埋め込みを加えたAVR+、さらに音源方向推定誤差を損失に追加したAVR++を実装しています。
NAFでは、NAFに多チャンネル埋め込みを加えたNAF+を実装しています。


引用

@article{加藤 雅大2025,
  title={ニューラル音場推定による仮想音場でのマイクロフォンアレイ音源定位評価},
  author={加藤 雅大 and 小島 諒介},
  journal={人工知能学会第二種研究会資料},
  volume={2025},
  number={Challenge-068},
  pages={03},
  year={2025},
  doi={10.11517/jsaisigtwo.2025.Challenge-068_03}
}