NotebookLM の新しい「シネマティック ビデオ」ツールの仕組み

in tech

NotebookLM は、Google のより洗練された、研究に焦点を当てた AI ツールで、Gemini と同じ基礎モデルに基づいて構築されていますが、おしゃべりが少なくフレンドリーなインターフェイスを備えています。 Gemini と同様に、定期的にアップグレードや新機能が追加されており、最新のアップデートでは「映画のような」ビデオ概要が追加されています。

NotebookLM が最適なタスクの 1 つは、大量の情報 (PDF、Web リンク、YouTube ビデオ) をノートブックに収集し、それを説明して要約することです (その点で、これは優れた学習ツールです)。数年前に、ノートブックからオーディオ オーバービューと呼ばれるリアルなサウンドのポッドキャストを生成する機能が追加されたことを覚えているかもしれません。

NotebookLM ビデオの概要

ビデオ概要の新しいシネマティック オプション。
クレジット: ライフハッカー

昨年、ビデオ概要を入手しましたが、これらはミニ ムービーというよりはスライド ショーに似ていて、基本的にはノートブックの内容を PowerPoint で作成したようなものにまとめたものでした。ただし、この新しいシネマティック アップグレードでは、よりアニメーション化された 3 次元のビデオ概要が得られます。

かなり重要な注意事項がいくつかあります。この新しいビデオ概要カテゴリにアクセスするには、月額 250 ドルの最上位プランである Google AI Ultra プランに加入している必要があります。さらに、18 歳以上のユーザーのみが利用でき、英語でのみ利用できます。この機能は最終的にはすべての人に浸透するかもしれませんが、今のところ、これにアクセスできるようにするには、比較的裕福な AI 愛好家である必要があります。

AI に毎月費やすのは多額の費用ですが、Google AI Ultra にはそれ以外にも、YouTube Premium のサブスクリプションや、これから作成する AI 生成の画像や動画をすべて保存するための 30 TB の Google ドライブの容量など、特典がたくさんあります。 Gemini と NotebookLM では、ほぼすべての項目で使用率が高くなります。

新しい映画の概要をテストするために、私は単一の情報源に基づいて NotebookLM で新しいノートブックを作成しました。それは、NotebookLM が利用するような大規模推論モデル (LRM) によって示される「思考の錯覚」について Apple の研究者によって発表された論文です。これは 39 ページにわたる分厚い研究であり、まさに AI で要約する必要があるような長大な文書です。

映画的な違い

NotebookLM で利用できるモバイル アプリもありますが、インターフェイスは Web で管理する方が簡単です。このツールを初めて使用する場合は、 新しいノートブックを作成する まず始めに、NotebookLM をソースに向けます。それが貼り付けたいプレーンテキストであっても、アップロードしたい Apple AI 研究であってもです。このアプリは、Web 上で他の関連ソースを検索することもできます。

実際に情報を集めたら、 ビデオの概要 オプションは右側の Studio パネルにあります。以下から選択できます 簡単な 概要または詳細 説明者 スタイルを選択し、概要のテンプレートも選択します。ビデオをどのように構成するかについていくつかのヒントを提供するスペースもあります。有料の Google AI Ultra メンバーの場合は、 映画的な オプション。

これまでのところどう思いますか?

まず、Apple AI 論文の説明形式のビデオ概要をリクエストしました。生成には約 15 分かかり、長さは 6 分強でした。上で見られるように、論文の内容をうまく説明し、LRM が複雑なタスクで行き詰る理由のいくつかを示しています。

これは非常に静的なスライドショーですが、よくレイアウトされており、イラストは 1 つか 2 つの異常はあるものの、概ね理にかなっています。最初のクロード ソネット グラフには、そこにあるべきではない 2 本の余分な線があります。この論文を読めばこの論文を十分に理解できますが、私はこれに100パーセント依存したくありません(AIは「不正確になる可能性がある」という免責事項をGoogleはGeminiとNotebookLM全体に掲げています)。

映画風のビデオ概要は生成に 50 分以上かかり、長さは 7 分以上あります。以下でご覧いただけます。良い面としては、より詳しく説明されており、見た後はそのトピックについてより深く理解できたように感じました。すべてのグラフは紙から正確にコピーされており、いくつかのアニメーションは本当に役に立ちました。

ただし、NotebookLM は特定のアニメーションで明らかに苦労しました。たとえば、誰かがページに絵を描いたり、ハノイの塔のパズルでブロックを重ね合わせたりする様子を表示しようとしたときです。これらは、他の AI 生成ビデオでも明らかな顕著な問題です。これらのモデルは、現実世界や物理学を実際には理解していないためです。トレーニングされた膨大な量のビデオ映像から、ピクセルを配置する場所については良いアイデアが得られますが、オブジェクトがどのように相互作用するべきかについては実際には理解できません。

私は全体的にシネマティック ビデオの概要の方が好きでしたが、結果は NotebookLM に供給するソースによって明らかに異なります。研究論文以外では、もう少し創造的で興味深いものになるかもしれません。ただし、視覚的なエラーは気を散らすものであり、結局のところ、誰もがアクセスできる標準のビデオ概要は、機能強化なしでも十分に機能します。

関連記事

前の投稿
ESP32 ボードを使って安価に構築できる 6 つのスマート ホーム デバイス
次の投稿
r/homelab はお金を無駄にします