Passer à la navigation principale Passer à la recherche Passer au contenu principal

Recovering Dense Metric Depth in Indoor Scenes from Monocular Depth Foundation Models and 2D LiDARs

Résultats de recherche: Le chapitre dans un livre, un rapport, une anthologie ou une collectionContribution à une conférenceRevue par des pairs

Résumé

Recently, the first foundation models for monocular depth estimation such as Depth Anything have emerged . However, by being trained to make affine-invariant predictions, these methods rely on fine-tuning for making metric depth predictions and therefore perform poorly on zero-shot metric depth estimation. In a real use case, the fine-tuning stage is costly because a dedicated dataset with ground truth depth must be created and used as a training set. Additionally, fine-tuning can compromise the model’s generalization ability. This paper proposes to leverage 2D LiDARs to rescale Depth Anything’s predictions in the context of indoor scenes so as to prevent expensive fine-tuning or harming the model capacity. Our experiments demonstrate similar performance with fine-tuned approaches and enhanced results over zero-shot metric depth estimation methods.

langue originaleAnglais
titreEuropean Robotics Forum 2025 - Boosting the Synergies between Robotics and AI for a Stronger Europe
rédacteurs en chefMarco Huber, Alexander Verl, Werner Kraus
EditeurSpringer Nature
Pages236-241
Nombre de pages6
ISBN (imprimé)9783031894701
Les DOIs
étatPublié - 1 janv. 2025
Modification externeOui
Evénement16th European Robotics Forum, ERF 2025 - Stuttgart, Allemagne
Durée: 25 mars 202527 mars 2025

Série de publications

NomSpringer Proceedings in Advanced Robotics
Volume36 SPAR
ISSN (imprimé)2511-1256
ISSN (Electronique)2511-1264

Une conférence

Une conférence16th European Robotics Forum, ERF 2025
Pays/TerritoireAllemagne
La villeStuttgart
période25/03/2527/03/25

Empreinte digitale

Examiner les sujets de recherche de « Recovering Dense Metric Depth in Indoor Scenes from Monocular Depth Foundation Models and 2D LiDARs ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation