国際交流助成受領者/国際会議参加レポート

令和元年度 国際交流助成受領者による国際会議参加レポート

受領・参加者名
金 ダベ
(東京大学 大学院工学系研究科 精密工学専攻)
会議名
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2019)
期日
2019年5月12日~17日
開催地
Brighton, United Kingdom

1. 国際会議の概要

会場 (Brighton Centre) の前にて

Signal Processing Society(信号処理学会)が主催するIEEE 41th International Conference on Acoustics, Speech, and Signal Processing (ICASSP2019) は2019.5.12~17期間中にイギリスのブライトンにて開催された。ICASSPは信号処理とその応用分野に焦点を当てている大きな学会である。ここでいう信号とは、音響、音声、画像、映像等を包含するものであり、取得した信号をどのように処理して解析・応用するかを議論することが本学会の主な目的である。学会発表は主にポスターセッションとオーラルセッションに分かれており、4ページの原稿をもとにどのセッションに属されるかが決まる。それ以外にも、プレナリースピーチや企業ブースによる展示等、様々なイベントが企画されている。特に、今年はケンブリッジ大学の教授やGoogleの研究者によるプレナリースピーチがあり、技術的な話だけではなく、物事の捉え方等、様々な話を聴くことができた。Googleの研究者であるCorinna Cortes氏は、携帯から個人情報がどのように暗号化され、個人のプライバシーを守っているかをテクニカルな要素まで説明した。

ICASSPは信号処理の学会ということで、様々な分野からの研究者たちが集まり、豊富な話がある学会である。例えば、楽器の音響をチューニングする研究や音声認識の人工知能に関する研究、そして画像・映像を解析してカメラ情報を利用する方法論に関する研究などがあった。自分の分野だけではなく、全く関わらなかった分野の興味深い話を聴くことができる有意義な学会である。ICASSPの大きな特徴として、学会のメンバー同士の熱い議論がある。自分が理解できない部分や疑問点があれば、躊躇なく聞きに行ったり、発表者から積極的に声をかけに行ったりする様子が印象的な学会である。また、大人数が参加する学会なので雰囲気はいきいきして立ち止まって話し合ったり、活発に議論したりする様子だった。

2. 研究テーマと討論内容

私が発表した研究テーマは、全天球カメラの回転推定における精度向上であった。全天球カメラは二つの魚眼レンズを背中合わせしたカメラであり、360度の視野角を持って全方向の情報を取得できるのが特徴的である。また、カメラを搭載した移動ロボットの環境センシングにおいて、フレーム間の画像からカメラの回転量を推定することは重要な要素である。一方、推定方法として、近年に深層学習の手法が提案されている。本手法は、大量の学習データによってネットワークの学習を行い、多様な環境に対する頑強性と推定の高速性に注目している。また、深層学習の一部である畳み込みニューラルネットワーク (CNN) は、入力画像の特徴量をネットワークが自動生成する特徴があり、非線形の損失関数の最適化に特化したネットワークである。本研究では、CNNを用いた学習による回転推定を行っている。上述したように、広視野角を有する全天球カメラは、視野の制限がある一般的なカメラに比べて、推定精度が期待される。しかし、球面上に像を投影する全天球カメラの球面画像を平面上に引き伸ばすと画像に歪みが生じる。この歪みは回転推定の精度を低下させる。一方、画素の動きをベクトルで表現したオプティカルフローという表現子があり、取得シーンの3次元情報に依存されない利点がある。本研究でもオプティカルフローによる回転推定を行う。しかし、上述したように、平面画像(正距円筒画像)には歪みが存在し、オプティカルフローにも影響する。また、この歪みは、同じ回転量で回転しても、回転軸によって直線や曲線のオプティカルフローのパターンが出てしまう。本研究では、回転軸に対する不均等な歪みを均等化させることで、回転推定の精度向上を図る。具体的には、取得したフレーム間の画像を球面上でロールとピッチ軸に対して90度ずつ回転を行い、各々のオプティカルフロー(計3つ)を入力データとしてCNNに入れることで、歪みの割合が均等化された学習ができ(つまり各回転軸に対して歪みの影響が平等になる)、約28%の回転推定の精度向上を実現できた。即ち、本研究で主に討論した部分は、歪みの均等化ネットワークのところであり、そこにオリジナルティがある。

3. 国際会議に出席した成果
(コミュニケーション・国際交流・感想)

ポスターの前にて

私は2時間のポスターセッションにて研究発表を行い、オーディエンスの方々と研究の紹介や内容に関する議論を行った。発表に来た人々は10人弱で、自分の原稿を見て来た人や、画像処理に興味がある人など、様々なオーディエンスが来て発表を盛り上げることができた。英語による発表とのことで、言葉の表現にやや制約はあったが、最終的には自分の研究内容を相手側に適切に理解させることができた。また、オーディエンスからもらったフィードバックを活かして今後の研究を進めることができると考えられる。自分の発表だけではなく、他人のポスターに行ってコミュニケーションすることもできた。私の研究は広視野角を有する全天球カメラを用いたもので、これを利用した関連研究がしばしばあった。例えば、正距円筒画像をキューブ画像に変換し歪みを除去した物体認識の研究や、正距円筒のマスクを用いたInpaintingの研究などがあり、自分と相手側の研究成果と知見を話し合うことができた。コミュニケーションが活発な学会の雰囲気もあって、たくさんの人々が自分のポスターに来て議論したり、逆に他人のポスターに行って説明を聞いたりすることができた。また、自分の研究では、オプティカルフローを直接に推定するのではなく、既存の手法を適用していたが、教師なし学習ベースでオプティカルフローの推定を行う研究が興味深かった。上述したように、本学会は信号という大きな枠組みの中で様々な種類の研究があり、個人的には新鮮であり、他の視点から自分の研究を見つめることもできた。今後開かれるSignal Processing Societyの他学会にも興味ができて、有意義な時間を過ごした。

令和元年度 国際交流助成受領者一覧に戻る

ページの先頭へ