視覚効果のためのトレーニング不要のニューラルマット抽出: 限界と結論

Posted on 7月 7, 2024

リンク一覧

5 限界と結論

我々は、ディープイメージプライアを使用したマット抽出アプローチを導入しました。アルゴリズムは単純で、既存の U-net に数十行のコード変更を加えるだけで済みます。我々のアプローチはトレーニング不要であるため、エンターテイメントビデオ制作における多様で種類の少ない主題に特に適しています。また、マット抽出問題の性質と解決の点で、本質的に理論的に興味深いものとなるかもしれません。さらに、DL トレーニングに使用するグラウンドトゥルースマットを作成することもできます。多くのマットアルゴリズムと同様に、トライマップまたは同様の制約の形で大まかなガイダンスが想定されます。これは、アーティストがすぐに利用できる半自動ツールを使用して作成できます。

計算コストは、従来の方法 (Levin 他 2008) と同様に、この方法の主な制限です。論文で示されている例の計算時間は、前世代の Nvidia Volta GPU 1 台で数分 (数時間ではありません) で測定されています。このため、このアルゴリズムの使用は、主に映画やビデオなど、大規模な非リアルタイム計算が標準である高品質のオフラインアプリケーションに限定されます。一方、計算では、ディープラーニングフレームワークで提供される複数の GPU のサポートを活用でき、中間結果を視覚化できます。

私たちの方法は、前のフレームから最適化をウォームスタートすることで、ビデオから時間的に一貫したマット抽出を生成できます (付属のビデオを参照)。ただし、私たちの経験では、これにはトライマップがフレーム間でスムーズに動くことが必要です。今後の課題は、トライマップの選択をより許容できる可能性のあるリカレントネットワークアーキテクチャまたはその他のネットワークアーキテクチャを検討することです。この論文では、DIP マットアルゴリズムの紹介に焦点を当てました。アーキテクチャとパラメータの調査は比較的少なく、さらに改善できる可能性があります。

謝辞

GG Heitmann、Peter Hillman、Kathleen Beeler は有益な洞察とフィードバックを提供しました。

参考文献

Adobe 2018。Photoshop で「被写体を選択」を使用してワンクリックで選択する方法。https: //www.photoshopessentials.com

Yagiz Aksoy、Tae-Hyun Oh、Sylvain Paris、Marc Pollefeys、Wojciech Matusik。2018。セマンティックソフトセグメンテーション。ACM Trans. Graph。37、4（2018）。

ゴジラVSキャット2021。https://www.youtube.com/watch?v=nf7GsKFepDg.

Mikhail Erofeev、Yury Gitman、Dmitriy Vatolin、Alexey Fedorov、Jue Wang。2015。ビデオマッティングの知覚的動機付けベンチマーク。British Machine Vision Conference にて。

Yossi Gandelsman、Assaf Shocher、Michal Irani。2019。「Double-DIP」：結合されたディープイメージ事前分布による教師なし画像分解。Comp. Vision and Pattern Recognition に掲載

Kaiming He、Christoph Rhemann、Carsten Rother、Xiaoou Tang、Jian Sun。2011。アルファマットのためのグローバルサンプリング法。Comp. Vision and Pattern Recognition

Kaiming He、Jian Sun、Xiaoou Tang。2010。「ガイド付き画像フィルタリング」。European Conf. Comp. Vision 誌。

GG ハイトマン。2020年。テクニカルアーティスト、Weta Digital からのメッセージ

Diederik P. Kingma と Jimmy Ba。2015。Adam: 確率的最適化の方法。国際会議「Learning Representations」。

Anat Levin、Dani Lischinski、Yair Weiss。2008。「自然な画像マッティングに対するクローズドフォームソリューション」IEEE Trans. PAMI 30、2 (2008)。

Shanchuan Lin、Andrey Ryabtsev、Soumyadip Sengupta、Brian Curless、Steve Seitz、Ira Kemelmacher-Shlizerman。2020年。リアルタイム高解像度背景マッティング。arXiv (2020)。

Y. A Mishima. 1992. 多面体スライスを使用したソフトウェアクロマキーヤー。NICOGRAPH 誌。

Christoph Rhemann、Carsten Rother、Jue Wang、Margrit Gelautz、Pushmeet Kohli、および Pamela Rott。2009。「画像マッティングのための知覚に基づいたオンラインベンチマーク」。Comp. Vision and Pattern Recognition に収録。

Olaf Ronneberger、Philipp Fischer、Thomas Brox。2015。U-Net: バイオメディカル画像セグメンテーションのための畳み込みネットワーク。MICCAI (2015)。

マイク・シーモア。2020年。LEDウォールバーチャルプロダクションの芸術。fxguide.com。

Yanan Sun、Chi-Keung Tang、Yu-Wing Tai。2021。セマンティックイメージマッティング。Comp. Vision and Pattern Recognition.

Dmitry Ulyanov、Andrea Vedaldi、Victor Lempitsky。2018。Deep Image Prior。Comp. Vision and Pattern Recognition.

Jue Wang および Michael F. Cohen。2007。「画像およびビデオのマッティング: 調査」。「トレンドコンピューティング」誌、3、2 (2007) に掲載。

Yong Xu、Baoling Liu、Yuhui Quan、Hui Ji。2022。Deep Matte Priorを使用した教師なしディープ背景マッティング。IEEE Trans. Circuits Syst. Video Technol. (2022)。

前の投稿

危険物対応における AI の役割

次の投稿

視覚効果のためのトレーニング不要のニューラルマット抽出: 概要と概要

視覚効果のためのトレーニング不要のニューラルマット抽出: 限界と結論

リンク一覧

5 限界と結論

謝辞

参考文献

関連記事

関連記事

高所恐怖症ならオハイオ州で一番高い橋には行かない

AI 言語モデルとして、インターネットを閲覧できず、イナリ市で利用可能なデータを見つけることができません。ただし、フィンランドにあるいくつかの人気のある都市を提案できます。

アラバマ州の2つのサソリ

ロッキー山脈は何歳ですか？

Oracle と OpenAI および Google Cloud とのクラウド契約が意味するもの

レイヴンスピリット動物の象徴と意味

トイ・フォックス・テリアとチワワの違いは？

アマゾンのオフィス復帰に対する反発は、労働者が賃金の引き上げを要求している中で起きている

アスパラガスとブロッコリー：5つの重要な違い

地球上でこれまでに掘られた最も深い穴は?

史上最高のビデオゲームコマーシャル

Windows PC で RTX AI チャットボットを使用して NVIDIA チャットを使用する方法

メニュー

メニュー