Claude の新しいビジュアル ツールを ChatGPT に対してテストしてみた

in tech

Claude は常にテキストとコードに重点を置いてきましたが、数日前、AI によって作成されたグラフィックス、モックアップ、スライドショー、およびその他の同様の素材を取得する方法である画像生成機能を公開しました。このツールスイートは Claude Design と呼ばれます。

その後、ChatGPT はすでに AI 画像生成に多くの投資を行っており、Images 2.0 と呼ばれる大幅なアップデートを公開しました。正確さ、一貫性、指示への従うことにおける「段階的変化」が約束されました。

では、これらの AI ツールを使用すると、以前はできなかった何ができるようになるのでしょうか?そして、その機能はどのように比較されるのでしょうか?

Claude Design はビジネスとエンタープライズに焦点を当てています

Claude Design は Claude 購読者向けに提供されており、Anthropic の言葉を借りれば、「デザイン、プロトタイプ、スライド、概要資料などの視覚的な作業」を目的としています。スケートボードに乗っている猫の写真は生成されませんが、 意思 プロジェクトのスライドショーや iPhone アプリのモックアップをまとめます。

これは、クロードのビジネスとエンタープライズへの焦点を継続します。クロードとコーディングするだけでなく、チームはプロトタイプを作成し、提案資料をまとめることができます。少し無味乾燥に聞こえるかもしれませんが、新しい機能は実際には非常に多用途であり、デモビデオで見られるように、回転するインタラクティブな地球儀が含まれています。

クロード・デザイン

Claude Design は編集可能なスライドデッキを作成します。
クレジット: ライフハッカー

まず、Claude に既存のコードベースからビジュアルを作成してもらったり、開始点として使用する既存の画像やドキュメントをロードしたり、テキスト プロンプトを入力したりすることができます。メインのチャットボット インターフェイスとは別に、特別な Claude Design ランディング ページに移動する必要があります。このページでは、ワークフローの動作方法を選択できます。

私は Lifehacker の価値を示すスライドデッキを作成することにし、スタイルのアイデアを得るために AI にいくつかのスクリーンショットを与えました。次にクロードは、作業に取り掛かる前に、テキストと画像の組み合わせ、スライドショーの長さなど、私が望むものについていくつかの質問をしました。 AI がリアルタイムでグラフィックスを構築する手順を「考え」、実行している様子を確認できます。

完成した作品が発表されると、見事に洗練されていました。Claude Design は、作品を他の場所にエクスポートするために必要なものをすべて提供します。最も便利な機能の 1 つは、ビジュアルの作成後に微調整できることです。私のスライド デッキでは、数回クリックするだけでアクセント カラー、フォント、スライドの密度を微調整できました。

クロード・デザイン

Lifehacker ニュース アプリになる可能性のあるもののモックアップ。
クレジット: ライフハッカー

さらにプロンプ​​トを介して編集をリクエストしたり、ビジュアルに描画して次に何が起こるかを示すこともできます。 Lifehacker ニュース アプリ候補の iPhone モックアップに移りますが、Claude Design はここでも素晴らしい仕事をしてくれました。1 つか 2 つの小さなグラフィカルな不具合を除けば、アプリのデザインは非常に Lifehacker らしく、ビジュアルに描画して変更したい内容を入力するだけで編集をリクエストすることができました。

すべてが洗練されており、プロフェッショナルで、操作も簡単です。 Claude Code と並んで Claude Design を使用している企業がたくさんありました。個人にとっては、スライドデッキを含むほぼあらゆるものをデザインするためのアイデアをまとめるのに便利な方法のように見えます(ただし、PowerPoint や Google Slides などのアプリ内の AI ツールの方が適しているかもしれません)。

ChatGPT Images 2.0 はビジネス用途だけでなく消費者向けにも焦点を当てています

ChatGPT とその Images 2.0 アップグレードに関しては、より一般化されており、ビジネス用途だけでなく消費者向けにも焦点が当てられています。 OpenAI によれば、プロンプトの指示がより厳密に従うようになり、最終結果の正確性と一貫性が向上し、テキストのレンダリングがさらに改善されました。タスクはより複雑になる可能性があり、画像もより「意図的にデザインされた」ように見えます。

これまでのところどう思いますか?

画像の作成はこれまでと同様に簡単です。クリックするだけです。 画像を作成する プロンプト ボックスに表示したい内容を説明します。人々は複雑な「ウォーリーはどこ?」を作ってきました。科学論文の画像、インフォグラフィック、雑誌の表紙の模擬。ライフハッカーに関する簡単な漫画を数分で作成することができました。

ライフハッカーコミック

ライフハッカーのコミック – デスクの配置が完全に変更され、コーヒーが熱くなることに注意してください。
クレジット: Lifehacker/ChatGPT

ChatGPT は、さまざまな品質の 2 つの Lifehacker 雑誌の表紙をモックアップできることも証明しました。確かに十分に現実的に見え、明らかな間違いやタイプミスはありませんが、同時に、多くの AI 画像に特有の一般的な雰囲気も持っています。これらの表紙は、ChatGPT のトレーニング データに吸い込まれたすべての雑誌の表紙の「平均化」を表していることがわかります。

ライフハッカー誌

お気に入りのライフハッカー誌の表紙を選択してください。
クレジット: Lifehacker/ChatGPT

ChatGPT Images 2.0 では、Claude Design のようにスライド デッキや複雑なものを構築することはできません。理論的には、単一のスライドやアプリのモックアップを作成することはできますが、一貫性や画面上にあるものを後で編集するという点では、さらに多くの制限があります。ChatGPT は、AI アートの 1 回限りの瞬間を重視しています。

新しい Images 2.0 モデルは、Web から実際の情報を取得する能力もはるかに優れているため、中つ国の漫画の地図をまとめたり (著作権に十分配慮しているため、トールキンの作品を完全にコピーすることはできませんが)、今後のスポーツ トーナメントに関する有益な図を作成したりすることもできます。これら両方のテストを実行したところ、ChatGPT は印象的な視覚的な結果をもたらしました。

ChatGPT よりも、Claude Design に最も近い比較は、おそらく Google ドキュメント、スプレッドシート、スライドを通じて利用できる Gemini AI ツールです。これについては、以前に書きました。まだプレゼンテーション全体を作成することはできませんが、簡単なプロンプトからスライドを作成したり、デザインの参照として他の資料を読み込んだりすることはできます。

Claude Design と同様に、フォローアップ プロンプトを使用して、最初からやり直すことなく、スライドショーやドキュメントのデザインの特定の側面を調整できます。また、完成した作品は、PDF や Microsoft Office と互換性のあるファイル タイプなど、さまざまな形式にエクスポートできます。

関連記事

前の投稿
EndeavourOS により Arch のインストールが簡単になり、CachyOS により使いやすくなりました
次の投稿
アップグレード アドバイザーは雰囲気コード化されたカオスですが、いずれにしてもホーム アシスタントの設定を保存する可能性があります