
今週は、OpenAI のおかげで、物議を醸している CEO の Sam Altman によるブログ投稿、アドバンスト音声モードの広範な展開、5GW データセンターの噂、主要なスタッフの再編、そして劇的な再編計画など、AI ニュースで非常に忙しい一週間となりました。
しかし、AI 世界の残りの部分は同じリズムで進むわけではなく、独自のことを行い、新しい AI モデルや研究を分刻みで量産しています。ここでは、先週のその他の注目すべき AI ニュースをまとめます。
Google Gemini のアップデート

火曜日、Google は、過去のリリースを反復する 2 つの新しい量産対応モデル、Gemini-1.5-Pro-002 および Gemini-1.5-Flash-002 のリリースを含む、Gemini モデル ラインアップの更新を発表しました。同社は、数学、長いコンテキストの処理、およびビジョン タスクで顕著な向上が見られ、全体的な品質が向上したと報告しました。 Google は、MMLU-Pro ベンチマークのパフォーマンスが 7% 向上し、数学関連のタスクが 20% 向上したと主張しています。しかし、Ars Technica をしばらく読んでいる方ならご存知のように、AI のベンチマークは通常、私たちが期待するほど役に立ちません。
モデルのアップグレードに加えて、Google は Gemini 1.5 Pro の大幅な値下げを導入し、128,000 トークン未満のプロンプトに対して入力トークンのコストを 64 パーセント削減し、出力トークンのコストを 52 パーセント削減しました。 AI 研究者の Simon Willison 氏がブログで述べたように、「比較のために、GPT-4o は現在、入力 (100 万トークン) あたり 5 ドル、出力 1 か月あたり 15 ドルであり、Claude 3.5 Sonnet は入力 100 万ドルあたり 3 ドル、出力 10 万あたり 15 ドルです。Gemini 1.5 Pro はすでにフロンティアモデルの中で最も安価ですが、さらに安くなりました。」
Google はレート制限も引き上げ、Gemini 1.5 Flash は 1 分あたり 2,000 リクエストをサポートし、Gemini 1.5 Pro は 1 分あたり 1,000 リクエストを処理できるようになりました。 Google の報告によると、最新モデルは以前のバージョンと比較して出力速度が 2 倍、遅延が 3 倍低くなりました。これらの変更により、開発者は Gemini を使用してアプリケーションを構築することが以前よりも簡単になり、コスト効率が向上する可能性があります。
Meta が Llama 3.2 を発表

水曜日、Meta は Llama 3.2 のリリースを発表しました。これは、過去に幅広く取り上げてきたオープンウェイト AI モデルのラインナップの重要なアップデートです。新しいリリースには、110 億および 90B パラメータ サイズのビジョン対応ラージ言語モデル (LLM) と、エッジおよびモバイル デバイス向けに設計された 1B および 3B パラメータの軽量テキスト専用モデルが含まれています。メタ社は、このビジョンモデルは、画像認識や視覚理解のタスクに関しては主要なクローズドソースモデルと競合する一方、より小型のモデルはさまざまなテキストベースのタスクに関しては同様のサイズの競合他社を上回るパフォーマンスを発揮すると主張している。
Willison は、いくつかの小型 3.2 モデルでいくつかの実験を行い、モデルのサイズに対して印象的な結果を報告しました。 AI 研究者のイーサン・モリック氏は、PocketPal というアプリを使用して iPhone で Llama 3.2 を実行していることを披露しました。
Meta はまた、さまざまな環境にわたる開発と展開を簡素化するために作成された、最初の公式「Llama Stack」ディストリビューションも導入しました。以前のリリースと同様に、Meta はライセンス制限付きでモデルを無料でダウンロードできるようにしています。新しいモデルは、最大 128,000 トークンの長いコンテキスト ウィンドウをサポートします。
Google の AlphaChip AI がチップ設計を高速化

木曜日、Google DeepMind は、AI 主導の電子チップ設計における大幅な進歩と思われるもの、AlphaChip を発表しました。これは 2020 年に研究プロジェクトとして始まり、現在ではチップ レイアウトを設計するための強化学習手法となっています。 Googleは、AIの動作を高速化するために設計されたGPUに似たチップであるTensor Processing Unit(TPU)の過去3世代で「超人的なチップレイアウト」を作成するためにAlphaChipを使用したと報じられている。 Googleは、AlphaChipは人力による数週間や数か月の労力と比較して、数時間で高品質のチップレイアウトを生成できると主張している。 (伝えられるところによると、Nvidia はチップの設計にも AI を活用しています。)
注目すべきことに、Google はまた、AlphaChip の事前トレーニング済みチェックポイントを GitHub 上でリリースし、モデルの重みを一般公開しました。同社は、AlphaChipの影響はすでにGoogleを超えて広がっており、MediaTekのようなチップ設計会社が自社のチップにこの技術を採用し、構築していると報告した。 Google によると、AlphaChip はチップ設計のための AI の新しい研究分野を引き起こし、コンピュータ アーキテクチャから製造までチップ設計サイクルのあらゆる段階を最適化する可能性があるとのことです。
それが起こったすべてではありませんが、これらはいくつかの主要なハイライトです。 AI業界は現時点で減速の兆しが見られないため、来週がどうなるかが分かるだろう。