Gemini ‘Omni’ はビデオをはじめ、あらゆる入力からメディアを生成します

in tech

今日の Google I/O 2026 では AI 関連の発表が矢継ぎ早に行われていますが、おそらく最も印象的なのは Gemini Omni と呼ばれる新しいマルチモーダル モデルでしょう。当初はビデオジェネレーターとして起動しましたが、最終的には入力側と出力側の両方で画像と音声も組み込むことができるようになります。

そのアイデアは、カスタム プロンプトを介して、さまざまなオーディオ、画像、ビデオをまったく新しいクリップにリミックスできるということです。現時点では、Gemini 内でテキスト プロンプトと画像からのみビデオを生成できるため、新しいものを生成するときに、オーディオ クリップと既存のビデオも組み合わせることができるようになります。複数の入力ソースが使用され、Google はリアリズムと精度の点でこれまで以上に優れた出力を生成できます。

画像と音声の生成が進んでいますが、Gemini Omni Flash と呼ばれるモデルにより、ビデオを作成する機能が最初に登場します。 Google が挙げている例では、携帯電話のギャラリーにある画像からいくつかのスタイルを選択し、それらを既存のビデオに適用しています。つまり、その気になれば、現実世界の自分のビデオを Pixar アニメーションのように見せることができます。

ジェミニオムニ

Omni を使用すると、ビデオ、画像、オーディオを新しいクリップに結合できます。
クレジット: Google

Googleによれば、「会話」を通じてビデオを編集することもできるという。この会話の側面は、すでに Gemini を使用してビデオを作成している人には馴染みのあるものです。見たいものを説明するだけで、Omni がそれを処理します。フォローアップ プロンプトを使用して、オブジェクトや色などビデオに関する特定の内容を変更したり、アクションが変化するシーンの独自の再撮影を作成したりできます。

ビデオの角度や環境を変更することもできます。たとえば、寝室からビーチのシーンに移動することもできます。 Googleによれば、元のクリップに戻ることができながら、複数回かけてビデオを調整できるという。

双子座の世界知識

Googleによれば、Gemini Omniは「物理学の直観的な理解」と「歴史、科学、文化的背景に関するGeminiの知識」を併用して、可能な限りリアルで一貫性のあるビデオを作成しているという。もっとも、これがすべてGoogleの言う通りに機能するかどうかは、自分で試してみる必要があるが。

Omni では、重力、運動エネルギー、流体力学などの力についての理解が深まったため、AI の奇妙さは少なくなるはずです。 Google によると、Gemini Omni はシーンを構築するだけでなく、次に何が起こるべきかを推論するそうです。

これまでのところどう思いますか?

AI ビデオは、物理法則に従うのではなく、トレーニング データ内の膨大な数のビデオからのパターンに従おうとするため、崩壊することがよくあります。人物がカメラの外から消えた場合、カメラがパンバックしたときにその人物がまだそこにいるとは限りません。 Googleは、Gemini Omniではこのような問題が少なくなると主張している。

ジェミニオムニ

Omni を使用するには、Google AI サブスクリプションにサインアップする必要があります。
クレジット: Google

ディープフェイクから保護するために、Google はビデオの作成にいくつかの制限を設けています。現時点では、出力を生成するために使用できるのは、自分の声と自分をベースにしたデジタル アバターのみです。さらに、すべてのビデオには、コンテンツが AI によって生成されたことを示す Google の目に見えない SynthID ウォーターマークが表示されます。

Gemini Omni Flash は現在、Google AI Plus、Pro、Ultra の加入者向けに、Gemini アプリと Google Flow で展開されています。今週後半には YouTube Shorts と YouTube Create アプリでも無料で利用できるようになります。

この記事の執筆時点では、使用制限については何も発表されていません。現時点では、Google AI Plus プラン (月額 7.99 ドル) を利用しているユーザーは、Veo 3.1 Lite モデルを使用して 1 日に 2 本のビデオを生成できます。 Google が Gemini Omni 世代に対してどれほど寛大であるかはまだわかりません。どうやら、Gemini Omni 世代がかなりの量の AI 処理能力を消費しているようです。

{このテーマについてさらに詳しく知りたい方は以下をご覧ください|関連情報は以下のリンクからご確認いただけます}

{完全ガイドはこちら|詳しい情報を見る|公式情報はこちら}

関連記事

前の投稿
2026 年に最も効率的なガソリンエンジンを搭載した SUV のコストは思ったよりも安い
次の投稿
Netflixはこのリン=マヌエル・ミランダのミュージカルを葬ったが、エンカントよりも優れている