
APSIPA Annual Summit and Conference(APSIPA ASC)は、アジア太平洋を中心に信号処理・情報処理分野で広く評価されている国際会議の一つであり、毎年多くの論文が投稿されます。2025年の会議は、2025年10月22日から24日、シンガポールのシャングリラで開催されました。本会議の主なテーマは信号・情報処理全般で、その中でも信号処理理論と手法、音声・言語・音響、音声認識、マルチモーダルAIや生成AI/大規模言語モデルなど、幅広い分野の研究発表が行われました。発表形式は、フルペーパーについて5分間の口頭ショートプレゼンと30分間のポスター・インタラクションを組み合わせた形が採用され、効率的かつ活発な議論が促進されました。大規模な国際会議であり、セッション中の議論だけでなく、ウェルカムレセプションやバンケットなどの交流の場でも活発な意見交換が行われている印象を受けました。

私は「Switching Constant Separating Vector for Moving Source Extraction with Geometric Constraints(幾何拘束付き移動音源抽出のためのスイッチング定数分離ベクトル)」というタイトルにて口頭発表を行った。本研究は、対象音源(SOI)が移動する状況で難易度が高まるブラインド音源抽出(BSE)に取り組むものである。補助関数最適化付き定数分離ベクトルに基づく独立ベクトル抽出(CSV-AuxIVE)は、ブロックごとに変動する混合モデルを用いながら時間不変の分離ベクトルを推定して移動SOIを抽出する手法であるが、マイクロホン数が限られる場合に性能が低下するという課題があった。そこで我々は、時間ブロックおよび周波数ビンごとに異なる分離ベクトルを許容するスイッチング機構を導入したSwCSV-IVEを検討してきたものの、状態間の置換曖昧性に起因する不安定性が残る。これらの課題に対し、本論文では幾何学的制約(GC)を取り入れたGC-SwCSV-IVEを提案し、SOIの到来方向(DOA)情報を活用してスイッチング分離ベクトルの最適化を誘導し、頑健性を向上させる。また、最適化過程の数値安定性を高めるために状態正則化手法も導入した。各種マイクロホン構成における実験結果から、提案手法は抽出性能と推定精度の双方で有意な改善を達成することが示された。
今年のAPSIPA ASC 2025 に参加できたことは、私にとって非常に貴重な経験となりました。今回の発表内容は、修士課程中の研究の一部をまとめたものであり、「Switching Constant Separating Vector for Moving Source Extraction with Geometric Constraints(幾何拘束付き移動音源抽出のためのスイッチング定数分離ベクトル)」というタイトルで口頭発表を行いました。発表では、移動する対象音源の抽出においてスイッチング機構と幾何学的制約を組み合わせることで頑健性を高める手法について報告し、多くの研究者から有益なフィードバックと具体的な提案をいただくことができました。修士課程を締めくくるにあたり、このような形で成果を共有できたことは大きな励みとなり、博士課程に進むにあたって良いスタートを切れたと感じています。
会議中は、自分の専門分野に限らず、関連する幅広いセッションに参加しました。特に印象に残っている研究の一つは、ニューラルネットワークによる逐次DOA推定と拡張カルマンフィルタを統合し、遅延和ビームフォーマと組み合わせて移動話者の追跡と雑音抑圧を同時に行うアプローチです。これは、信号の統計モデルと幾何拘束に基づいて抽出ベクトルを最適化する私の研究とは異なる立場から問題に取り組んでおり、発表後に登壇者と互いの共通点・相違点を議論することで、自身の手法の適用条件や限界に対する理解を深めることができました。今後は、彼らの追跡・推定機構を参考にしたハイブリッド化や、評価指標・実験設定の見直しなど、新たなアプローチとして発展させていきたいと考えています。
最後に、本国際会議への参加にあたり、貴財団から多大なるご支援を賜りましたことに、心より御礼申し上げます。今回得られた貴重な学びとネットワークを糧に、今後の研究活動に一層邁進してまいります。
