しまった訳し方、というか理解の仕方を勘違いしてました。
「Boosting Monocular Depth Estimation Models to High-Resolution via Content-Adaptive Multi-Resolution Merging」というやり方を実現するために、MiDaSやLeResという手法を使って、Multi-Resolutionのデプスマップを生成しよう、というものなのか。
いずれかの手法で、複数解像度から得られたデプスマップをMergingすると、より精度の高いデプスマップが得られるよ、というものが、より正しい理解のように読めてきました。
となると、単独のMiDaSやLeResの結果も知りたくなるな。。。