DNNを用いたカメラの6自由度相対運動推定

Abstract

これまで複数枚の画像からカメラ運動とシーン構造を同時推定する Structure from Motion に関する手法が広く研究されてきた.多くの手法では画像上の特徴点を抽出し特徴の対応関係からカメラ運動とシーン構造を推定する.しかし,空や道路などのように画像上に特徴の少ないシーンでは,特徴点を検出できず推定に失敗することがある.このような理由から,より多様なシーンにおいてカメラの相対運動とシーンの 3 次元構造を頑健に推定可能な手法が求められている.本研究では,畳み込みニューラルネットワークを用い,2 枚の入力画像から直接カメラの相対運動を推定する手法を提案する.加えて,畳み込みニューラルネットワークで計算した特徴量を Long Short-Term Memory (LSTM) に入力することにより,時系列画像における過去の情報を考慮したカメラの相対運動を推定する手法を提案する.