「ニューラル音場推定による仮想音場でのマイクロフォンアレイ音源定位評価」のソースコードです。
多チャンネル音場推定(AVR/NAF)の学習・推論、シミュレーションデータ作成、実データの整形、評価までをまとめています。
実行方法の詳細は、各ディレクトリのREADME.mdに記載しています。
multichannel-soundfields/
├ README.md ドキュメント
├ LICENSE ライセンスファイル(MIT License)
├ AVR/ 音場推定手法:AVR(Acoustic Volume Rendering)
├ AcoustiX/ シミュレーション:AcoustiX(レイトレーシング)
├ NAF/ 音場推定手法:NAF(Neural Acoustic Fields)
├ Pyroomacoustics/ シミュレーション:Pyroomacoustics(鏡像法)
├ metrics/ 推定信号の評価
└ real_data/ 実データのダウンロード・整形
実データのダウンロードと整形はreal_dataにまとめています。
シミュレーションデータはAcoustiX(レイトレーシング)とPyroomacoustics(鏡像法)で作成します。
多チャンネル音場推定の手法として、AVRとNAFを用意しています。
AVRでは、AVRに多チャンネル埋め込みを加えたAVR+、さらに音源方向推定誤差を損失に追加したAVR++を実装しています。
NAFでは、NAFに多チャンネル埋め込みを加えたNAF+を実装しています。
@article{加藤 雅大2025,
title={ニューラル音場推定による仮想音場でのマイクロフォンアレイ音源定位評価},
author={加藤 雅大 and 小島 諒介},
journal={人工知能学会第二種研究会資料},
volume={2025},
number={Challenge-068},
pages={03},
year={2025},
doi={10.11517/jsaisigtwo.2025.Challenge-068_03}
}