(jp) =
それは芸術を人工知能に置きます。
人々は最近、ニューヨーク市警に積極的に逮捕されたドナルド・トランプの写真と、オンラインで広く出回っている豪華なバレンシアガのふくらんでいるコートを着ている教皇フランシスコの写真に当惑しました。
それらは偽物でしたが、信じられないほど説得力のあるものでした。
どちらの画像も、アートやグラフィック デザイン、デジタル カルチャー、AI の専門家である Jamie Cohen 氏によると、急速に変化している AI プログラムである Midjourney によって作成されました。
CUNY クイーンズ カレッジの教授は、「1 年で、このような優れた品質に進歩しました。
「今から 1 年か 2 年後に完全ではない世界を想像することはできません。」
Midjourney は、Cohen 氏によると、Stable Diffusion と呼ばれる AI を使用して、ユーザーのプロンプトに基づいて超リアルな写真やイラストをシームレスに作成するガイド インターフェイスです。
「Midjourney がハンドルであり、Stable Diffusion が車のエンジンであると考えてください」と Cohen 氏は述べ、前者は高密度 AI をはるかにユーザーフレンドリーにすると付け加えました。
ニューヨーク・ポストのアーティスト、ピーター・ラヴィーニャはミッドジャーニーをテストし、スカイブルーのドレスを着て足を組んだ女性教師の一連の画像を、20 人の異なるアーティストのスタイルで作成するよう促しました。 わずか数秒で、サルバドール・ダリから漫画家のギル・ケインまで、あらゆる人物とまったく同じスタイルの写真を吐き出します。
昨年 7 月にベータ モードで公開されたこの技術は、以前 NASA の契約業務を行っていた、サンフランシスコを拠点とする CEO の David Holz 氏の発案によるものです。
「私たちは人類の想像力を広げようとしていると言いたいです。 目標は人間をより想像力豊かにすることであり、想像力豊かな機械を作ることではなく、これは重要な違いだと思います」とホルツ氏は 2022 年にフォーブスに語っています。
人気の ChatGPT から遠く離れていない Midjourney のコア ソフトウェアは、Holz 氏の言葉を借りれば「インターネットのほんの一部」に過ぎない、非常に広大なビジュアル データセットを備えた言語ベースの学習モデルです。
Midjourney は、画像ベースの AI テクノロジのはるかに大きな波の一部です。 ChatGPT の親会社である OpenAI (最近 Microsoft から 100 億ドルの投資を受けた) は、DALL-E として知られる独自のテキストから画像へのプログラムを持っています。 しかし、Midjourney によって作成された画像は、より本物に見えます。
「旅の途中では、よりフォトリアリスティックな出力が得られます [than DALL-E]」とコーエンは言いました。 「それは大きな前進です。」
これらの偽の画像が誤った情報を広めるためにどのように使用される可能性があるかについて警鐘を鳴らしている人もいます. トランプが手錠をかけられている写真はニュース報道と照合される可能性がありますが、ソーシャルメディアの多くは当初、クチュールを着た教皇フランシスにだまされ、すぐにオンラインで広まりました.
そのようなジェネレーティブ AI は、AI のビデオとオーディオが既存のコンテンツにオーバーレイされる「ディープフェイク」よりも強化されています。
「ジェネレーティブ AI とディープフェイクが融合し始めると、誤った情報が史上最高に達すると思います」と Cohen 氏は述べています。 「それが起こったとき、あなたはただ現実を創造するだけです…どうやってそれを認識しますか? 簡単なことではありませんが、多くのメディア リテラシー スキルを適用する必要があります。」
Midjourney の CEO である Holz 氏は、このような懸念から、すでに彼のプログラムへのアクセスを制限しています。
最近、偽のトランプの写真が急増したため、Midjourney はプロンプトから「逮捕された」という言葉を禁止しました。 Gizmodoによると、彼は今週初めにソフトウェアの無料試用版を停止した、と彼はDiscord経由で述べた.
「膨大な数の人々が無料の画像を得るために使い捨てのアカウントを作成したため、トライアルを中止しました」と彼はアウトレットに語った。
アクセスするには、ユーザーは 10 ドルから 60 ドルのプランに加入できます。
昨年の夏、ホルツは中国の習近平国家主席の写真も「ドラマを最小限に抑えるため」禁止した。
「中国の政治風刺はまったく問題なく、ある時点で中国の人々を危険にさらすことになるでしょう。 [C]ひながサービスを利用することはありません」とHolzはDiscordに書いています。
年齢に適したコンテンツも、ジェネレーティブ AI の継続的な問題です。 実在の人物の偽のポルノを作成するなど、プライバシーも同様です。
Midjourney では、生成されたすべてのコンテンツは「PG-13」でなければなりません — Stable Diffusion はヌードとポルノ素材を使用して「訓練」されていますが。 Holz 氏でさえ、会社が適切なガイドラインを作成するのに苦労していることを認めています。
「適切なモデレーション ポリシーとは何かをまだ理解しようとしているところだと思います。 私たちは専門家やコミュニティからフィードバックを受けて、本当に思慮深くなるよう努めています」と Holz 氏は Gizmodo に語っています。
生成された画像の品質は驚くべきものですが、Cohen 氏によると、特に手、影、宝石、眼鏡、背景に細心の注意を払うことで、偽物を見分けることができます。 画像を逆検索することでも手がかりを得ることができます。元の写真が表示されない場合は、ソフトウェアで生成された可能性があります。
それでもコーエン氏は、適切なツールがなければ、偽物を「今から 1 年後に見分けるのは非常に難しい」と述べています。
また、ジェネレーティブ AI 分野で著作権の問題が浮上している一方で、画像の使用をめぐる訴訟も発生していますが、アート界の誰もが心配しているわけではありません。
ミッドタウンを拠点とする鑑定士である Art Experts のマーク ウィンター氏は、作品の真の価値は常にその作成者と結びついており、アイデアのリミックスは古代の世界にまでさかのぼると述べています。
「ギリシア人にさかのぼる記録があります。基本的に、あるアーティストの作品を、才能がなく創造性に欠けるアーティストがリサイクルしたり、盗んだりしていました」とウィンターはポストに語った. 「これで何か違うの? 私はそうは思いません。」
彼はまた、新しい創造的な可能性が開かれるという見通しに興奮しています.
ウィンター氏は、「これは、言葉にするのが難しいあらゆる種類のことが可能になる、まったく新しい窓になる可能性があります。 「私たちの生産性でできることは大幅に拡大すると思います。 . . 驚異的なものになると思います。」