NeX: Real-time View Synthesis with Neural Basis Expansion (CVPR 2021)

NeX: Real-time View Synthesis with Neural Basis Expansion
https://nex-mpi.github.io/



Multiplane Image (MPI)を使った新視点画像を生成の研究.入力画像はfoward facingの画像12枚以上を想定している.

MPIを使った新視点画像生成手法としては以前紹介した以下の論文などがある.

Synthesizing Light Field From a Single Image with Variable MPI and Two Network Fusion (SIGGRAPH Asia 2020)
https://moitkfm.blogspot.com/2021/03/synthesizing-light-field-from-single.html

これまでのMPIベースの新視点画像生成では各平面の色情報としてRGBαの情報を保持していたが,NeXでは視線方向に応じた各ピクセルの色はNeural Networkによって推定された基底関数の組み合わせで表現される.基底関数は全てのピクセルで同じものを利用する.


MLPの入力となる画素の位置x, y, dについてはNeRFと同様にPositional Encodingを採用し,x, yについてはそれぞれ20次元,奥行dについては16次元にマップすることで56次元の入力となっている.

提案手法を用いることで,構造色のような視点位置によって見た目が大きく変化する複雑な反射も再現できていることが分かる.定量評価では,NeRFを含む既存手法よりも全てのデータセットにおいて高品質な画像を生成することが可能であった.


また,提案手法はレンダリングにかかる時間も少なく,NeRFの約1000倍高速にレンダリングできる.デモページではサンプルのシーンで視点をインタラクティブに変化させることが出来る.実際に試してみたが,GeForce GTX 1080 TiのPCだと60fpsでの画像生成が可能だった.


コメント

このブログの人気の投稿

COLMAPでキャリブレーション済みのデータを使う

5点アルゴリズムによるカメラ位置・姿勢の推定

2D-3D対応からのカメラ位置・姿勢の推定