Practical Face Reconstruction via Differentiable Ray Tracing (arXiv Jan. 2021)

Practical Face Reconstruction via Differentiable Ray Tracing
https://arxiv.org/abs/2101.05356

1枚の顔画像から3Dの顔モデルを生成する研究.生成されるモデルは3次元の形状に加え,Albedo, Specular, Roughnessのテクスチャマップを保持.また,生成の過程でIlluminationも推定.


提案手法では,A Morphable Face Albedo Model (CVPR2020)で提案されたAlbedoとSpecularの情報を含んだ3D Morphable Model (3DMM)を入力の顔画像にフィッティングすることで,顔形状に加え初期のAlbedoとSpecularのテクスチャマップ,顔領域に対するライティングの情報を得ている.その後,Ray TracingベースのDifferentiable Rendererであるrednerを用いて,各テクスチャマップの最適化およびRoughnessマップの生成を行う.3DMMのフィッティング結果を最適化の際の制約として用いることで,安定したテクスチャの分離を実現している.



また,光源環境についても推定を行っているが,環境マップのようなテクスチャを推定するのではなく,ライトステージのようにドーム状に設置した仮想ライトの強度を推定するようになっている.512x512画素のテクスチャ生成に,初期のフィッティングに約5分,Differentiable Renderによる最適化に約1分程度かかる.

論文の結果を見る限りではalbedoに関しては最適化前後でほとんど結果が変わっていないように見える.制約がきつすぎるのか?

コメント

このブログの人気の投稿

COLMAPでキャリブレーション済みのデータを使う

5点アルゴリズムによるカメラ位置・姿勢の推定

2D-3D対応からのカメラ位置・姿勢の推定