CESの会場
ICCE (International Conference on Consumer Electronics) は、IEEE Consumer Electronics Society主催の国際会議であり、毎年の1月にラスベガスで開催される世界最大級の見本市Consumer Electronics Show (CES) と同じ場所 (Las Vegas convention center) で開催される。今回は36回目である。
今年のICCE 2019のメインテーマは「Smart Electronics: Paradigms for Secure and Green Solutions」で、会議ではスマートエレクトロニクスを中心に据えて、スマートヘルスケア・ディープラーニング・IoTなど、7件のキーノートスピーチが行われた。一般発表もこれらのトピックに関係する12分野に分かれ、アジア各国をはじめとして世界中から研究者が集まり、発表を行った。今回は深層学習・人工知能に関する発表件数が特に多く、AIがConsuming Electronicsの業界でさらに注目されていることを示している。
本国際会議の「Machine learning, Deep learning and AI in Consumer Electronics」セッションにて、「Orientation and Occlusion Aware Multi-Person Pose Estimation Using Multi-Task Deep Learning Network」というタイトルでオーラル発表を行った。
オーラル発表の様子
本研究は、深層学習を用いた単発画像における姿勢認識での従来の手法に基づき、新しい特徴を情報としてマルチタスクモデルを構築し、ネットワーク出力の多様化と精度の向上を試みた。
本研究のベースとなった手法は、state-of-the-artのトップダウン型アプローチのMask R-CNNである。本研究はMask R-CNNに既存した物体検出・セグメンテーション・姿勢認識を行う上に、人の向きを表示する「オリエンテーションマスク」と複数人物の重ね合いを表示する「オクルージョンマスク」といった二つのタスクを加え、新しいマルチタスクネットワークを構築した。学習のために、MSCOCO Keypoint Challengeデータセットに基づき、新しい二つの情報をラベルとして付けたサブセット(約3,000枚)を自ら作り、学習を行った。また、各タスクを並行的に行う単純なパラレルモデルがバックボーンネットワーク(ResNet101)のフィーチャーマップしか共有できないため、各タスクが担当する情報(特徴)の関係性を検討し、タスク出力を他のタスクに再入力するシリアルモデルを提案した。
本研究の結果として、新タスクを加わったことにより、ベースとなった手法と比べて約4%PCK (Percentage of Correct Keypoint) が上昇した。また、シリアルモデルにパラレルモデル以上の学習効果が観られた。
最優秀論文賞授賞式
ICCEはCESと同時開催される学会のため、今回もかなり軽い雰囲気の中で行われていた。投稿した論文が最優秀論文賞に当たり、また初めて国際会議での発表なので、多少緊張していたが、英語でプレゼンテーションをして質疑応答した達成感が今回最大の収穫とも言える。また、ほかのポスター発表とオーラル発表を聞くことができ、研究に関する視野も広がった。各キーノート発表で、Consuming Electronicsに貢献をしている企業と研究機構の方々の話を聞くことも、これから社会人として働くことにとって良い勉強である。
最後に、本会議への参加に対してご援助をいただいた貴財団に心より感謝し、御礼を申し上げます。