Anthropic がついに Mythos を一般公開しましたが、厳重に守られているためほとんど機能しませんでした
Anthropic は、セキュリティの脆弱性を見つけて修正するための Claude Mythos AI モデルの能力を宣伝しており、ついに公開バージョンである Fable 5 をリリースしました。しかし、一部のサイバーセキュリティ専門家は、悪用を防ぐためのガードレールが現実世界での有用性を抑制していると不満を抱いています。
Fable は、Mythos プレビュー リリースや、OpenAI の GPT 5.5 や Google の Gemini 3.1 Pro などの従来の AI モデルよりも優れた推論、コーディング、サイバーセキュリティのタスクを実行できる「Mythos クラス」のモデルとして宣伝されています。これは理想的には、セキュリティ チームが欠陥を特定し、問題を調査し、比較的迅速に修正を開発するのに役立ちます。
Anthropic によれば、Fable 5 とそれに相当する Mythos 5 の違いは「安全装置」にあります。 Fable モデルがマルウェアの作成などの悪用のリスクがあると判断した場合、Claude Opus 4.8 に戻ります。 Mythos 5 にはそれほど多くの保護機能はなく、アクセスは、米国政府と Apple、Google、Microsoft、その他数百社を含む特定の企業の支援を受けて重要なソフトウェアを保護することを目的とした Project Glasswing イニシアチブのメンバーに限定されています。
新しい Fable バージョンと Mythos バージョンは、それぞれ 100 万入力トークンあたり 10 ドルと 50 ドルの価格で、つまり Mythos プレビューの半額以下で入手できます。 Anthropic のモデルの制限を減らしたいプロは、サイバー検証プログラムを通じて承認を得る必要があります。
一部のサイバーセキュリティ専門家にとって、Fable 5 はなぜそれほど悪いのでしょうか?
彼らはそれが安全すぎると感じています
Anthropic は、迅速な起動と安全性の両方を目的として Fable のガードレールを「保守的に」設定しており、「無害なリクエスト」によって機能が制限される瞬間があることを明らかにしています。今後、これらの保護機能が改善され、間違いが制限されることが期待されます。
として テッククランチ しかし、サイバーセキュリティのベテランはまだ喜んでいない、と氏は説明する。 IBMなどの専門家らは、安全なコードの作成やレビューを依頼するとOpusにダウングレードされ、「間違った」キーワードを使用するだけで制限が発動する可能性があると指摘している。人によっては、Fable を意図したとおりに使用するのが難しい場合があります。

ハッカーが恐ろしい新しい方法で利用できる 5 つの AI テクノロジー
マトリックスを取扱説明書だと思っている人もいます。
最初の注意は当然かもしれません。 AI は以前よりも簡単かつ迅速に脆弱性を発見して利用できるようになり、開発者が修正したり分析したりする時間がなかったゼロデイエクスプロイトにつながる可能性があります。
たとえば、Microsoft は 6 月に「パッチ チューズデー」という記録を打ち立て、チームとコミュニティが AI を使用して見逃していた問題を発見し、約 200 件のセキュリティ バグを修正しました。攻撃者が Fable や Mythos などのツールを制限なく使用できる場合、パッチが準備される前に比較的少ない労力で日常的にシステムを侵害できるリスクがあります。
関連情報は以下のリンクからご確認いただけます