AIは「攻撃」より先に「守り」に使う——Anthropic Project Glasswingが1ヶ月で1万件超の脆弱性を発見した意味 ‣ はてなベース株式会社

「AIで攻撃が高度化すれば、守る側はどうしようもなくなるのではないか」——ここ数年、セキュリティ業界でくり返し語られてきた懸念です。実際、巧妙なフィッシング、ディープフェイク、コード自動解析による脆弱性探索は、いずれもAIで以前より容易になりました。2026年5月に発表されたAIで破られやすくなったセキュリティ対策ランキングで見たとおり、攻撃側の優位が一時的に広がったのも事実です。

ただ、同じAIは守る側にも使えます。その典型例として2026年4〜5月に動き出したのが、Anthropic主導の Project Glasswing です。未公開の高性能モデル「Claude Mythos Preview」を、約50社の主要IT・金融企業に統制配布し、その能力を攻撃者より先に守る側で使い切る取り組みです。本記事では、Glasswingが出した数字、その配布方式の考え方、そして日本企業への示唆を整理します。

Project Glasswing とは何か

Glasswingは、Anthropicと主要IT・金融企業の連合による「重要ソフトウェアの脆弱性を、AIで先に潰す」共同プロジェクトです。発足時の発表パートナーには、AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksが含まれ、Mozillaなども実検証に参加しました。

用語メモ｜ゼロデイ脆弱性 — まだ修正パッチが存在しない、世間に知られていない脆弱性のこと。攻撃者がこれを掴むと、防御側が気付く前に攻撃が走るため、被害が広がりやすい。Glasswingは「攻撃者より先に守る側がゼロデイを見つけて潰す」競争に AIを投入したもの。

鍵となるのは、まだ一般公開されていない最先端モデル Claude Mythos Preview です。Anthropicは「AIは今や、最も熟練した一握りの人間を除けば、脆弱性の発見と悪用において人間を上回る」と公式に述べています。この能力を、攻撃者の手に渡る前に守る側で活用する——それがGlasswingの設計思想です。

背景には、Anthropicが採用する Responsible Scaling Policy（責任あるスケーリング方針） という考え方があります。能力が一定以上になったモデルは、安全策を整えるまでは広く公開しない。一方で、その能力を完全に封じてしまえば社会的便益も生まれません。Glasswingは、この方針を「具体的にどう運用するか」のひとつの答えとして提示された取り組みでもあります。

用語メモ｜Responsible Scaling Policy（責任あるスケーリング方針） — Anthropicが公表しているフロンティアAI開発の自主規制方針。モデルの能力レベル（AI Safety Level / ASL）に応じて、配布方法・安全評価・運用上のガードレールを段階的に強める仕組みです。Glasswingは ASL の高いモデルを「統制配布」で扱う運用例にあたります。

最初の1ヶ月で出した数字

Glasswingの実証結果は、AIが「守る側」でどこまで効くかを具体的な数字で示しています。Anthropicおよび各パートナーの公表値を整理すると、次のようになります。

特に印象的なのが、Mozillaの数字です。Firefox 150に対しMythos Previewでスキャンを走らせたところ、前世代モデル（Claude Opus 4）の同等スキャン比で10倍超の脆弱性が見つかり、271件のパッチに繋がりました。これは「AIが世代を1つ進むと、守りの解像度がオーダーで上がる」ことを示します。AIの世代交代はもう数値で効きはじめている、ということです。

Cloudflareでも、自社の重要システムにMythos Previewを走らせて約2,000件のバグを発見し、そのうち約400件は高/重大と判定されました。1社単体の数字としては衝撃的で、人手だけで同じ範囲・期間で同水準を出すのは現実的に困難です。

発見された脆弱性の中身は、メモリ安全性のバグ、入力検証の不備、認証ロジックの抜け、依存ライブラリ経由の波及など、いわゆる「人が見落としがちなパターン」が中心と報告されています。AIは網羅的に見ること・人が疲労する細部に粘り強く向き合うことが得意で、それが「人と AI で見落としを補完する」関係をはっきり示しました。

封鎖でも開放でもない——Glasswing の「中間解」

ここで湧くのが、「これほど強力なモデルを使えるのは50社だけなのか、なぜ広く公開しないのか」という疑問です。Anthropicの答えは明確で、Mythos Previewはまだ広く公開できる安全水準に達していない——攻撃にも転用できてしまうため、です。

Glasswingが取った中間解の図。選択肢A 広く一般公開すると攻撃者も同じAIを使いゼロデイ攻撃が拡散。選択肢B 完全に封鎖すると悪用は防げるが守る側の改善も止まる。Glasswingは統制配布＋共同検証で、安全性の歯止め付きで守る側に先行させる — 公開すれば攻撃側にも渡り、封鎖すれば守る側も使えない。中間に「統制配布＋共同検証」を置く

選択肢は本来3つあります。A. 広く一般公開する（改善は速いが攻撃に転用される）、B. 完全に封鎖する（リスクはないが守る側の改善も止まる）、そして C. 統制配布＋共同検証（信頼できるパートナーに限定して使わせ、共同で安全策を整備する）。Glasswingは明確にCを選びました。

この選択の含意は大きい。「AIの最先端能力は、どこかが先に持つ。それが攻撃者であってはいけない」という前提を、業界として受け入れた瞬間でもあります。少数の主要企業が責任を分け持って先行検証し、危険な出力を検知・遮断する安全ガードレールを実環境で鍛えてから、徐々に公開範囲を広げる。これが今後のフロンティアAIの標準的な配布パターンになる可能性が高いです。

日本企業への示唆——「攻めるAI」より先に「守るAI」

日本企業の多くは、Mythos Previewを直接使える立場にはありません。ただ、Glasswingが示した方向性は、規模を問わず参考にできます。要点は3つです。

ひとつ目は、「守りにもAIを使う」が、もう抽象論ではないということ。CloudflareやMozillaの数字を見れば、ログ監視、脆弱性スキャン、フィッシング検知、ふるまい異常検知といった守りの業務にAIを組み込まないと、攻撃側の速度に追いつけません。「AIは攻撃に使われると怖い」という議論に閉じず、自社の守りの現場でも同じAIを使う、という発想転換が必要です。AIを業務で運用するための前提整備はクラウドAIにも企業統制が乗る——28連携とCloudflare CASBの記事もあわせてご覧ください。

ふたつ目は、「AIのアウトプットだけ見ない、運用と歯止めを見る」こと。Glasswingが評価されたのは、能力の高さだけでなく、危険な出力を検知・遮断する仕組みとセットで配布した点です。日本企業がAIを採用する際にも、AIの能力比較表だけを見るのではなく、その配布元がどんなガードレールと運用支援を提供しているかを、選定の主軸に据える必要があります。

みっつ目は、「先行する50社」に学ぶ余地が大きいこと。Glasswingに参加した企業の多くは、検証結果やプロセスを段階的に公開しています。Cloudflareの公式ブログ、AnthropicのGlasswingページ、Mozillaのセキュリティアドバイザリは、いずれも一次情報として読み込む価値があります。海外のAI先行企業が「どう守りを更新したか」をそのまま学習材料にできる時期です。

具体例で言えば、自社の主要 OSS ライブラリの脆弱性レポートを最新のセキュリティ用 AI モデルで一度走らせる、社員向けフィッシング訓練の文面を AI で常時生成して検知率を計測する、社内のアクセスログから異常パターンを AI に下見させて夜間運用の負荷を下げる——どれもいきなり大規模に始める必要はなく、まずは一つの業務でAIに守りの作業を任せて評価する、というスケールから始められます。

AIが「次のAIを守る」時代へ

Glasswingの本質は、「人間が書いたコードをAIで監査する」だけでなく、その先の 「AIが作ったコードをAIで監査する」「AIが生む新しい脆弱性パターンをAIで先回りする」 という連鎖を業界レベルで動かし始めた点にあります。コーディングエージェントが急速に普及するなかでの、必然の打ち手とも言えます。コーディングエージェント特有のリスクはAIコーディングエージェントのセキュリティとガバナンスで扱っています。

とはいえ、Glasswingが示したのは「現状ではAIが攻撃にも転用しやすい段階にある」事実でもあります。Mythos Previewを広く公開できない、という判断は、それだけ攻撃側に渡したときのリスクが高いことの裏返し。だからこそ、組織側は 「いつ攻撃に使われ始めても困らない最低限の守りの底上げ」 を、待たずに着手する必要があります。

具体的に何から始めるかは、業種・規模で異なりますが、自社で稼働中の業務システムの脆弱性スキャンを、最新のAIで一度走らせるだけでも気付きは多いはずです。完璧を目指さず、まずは「守る側で1回AIを使ってみる」が、Glasswingが示した第一歩の縮図です。

現実的な初手の例を3つ挙げると、ひとつは自社で内製している管理ツールやAPIのコードを、最新のAIにレビューさせて潜在バグを洗い出すこと。ふたつ目は、社員に届くフィッシングメールの傾向をAIに分析させ、自社向けの注意喚起テンプレートを毎月更新すること。みっつ目は、認証ログ・アクセスログから「いつもと違う振る舞い」をAIに下見させ、人の目を通すべき件を絞り込むこと。いずれも追加投資が小さく、効果が見えやすい守りの初手です。

まとめ｜「攻めのAI」の話に閉じず、「守りのAI」を自社で動かす

AIの議論はどうしても「攻撃に使われたら怖い」「業務効率化に使うとコスト爆発」のように、リスクとコストの話に寄りがちです。Glasswingは、もうひとつの軸——「攻撃者より先に守る側で使う」——を、具体的な数字で見せた最初の大規模事例といえます。

「うちはMythos Previewなんて触れない」と感じる企業ほど、まずは自社の守りのプロセスを棚卸しし、どこにAIを組み込めるかを点検することから始めるとよいでしょう。海外の主要企業の歩みは、AIで先回りした守りの実例として、十分に参考になります。

もう一点だけ加えるなら、Glasswingの最大の含意は「フロンティアAIの配布のしかた自体が、世界全体のセキュリティ姿勢を左右する」と業界が認めた点です。今後、Anthropic以外のAI提供企業も、同様に「能力リリース前の共同検証フェーズ」を取り入れていく可能性があります。AIの能力評価表ではなく、配布の仕組みそのものを評価軸に据える視点を、いま組織として持ち始めておく価値があります。守りの側でAIを使い倒すことで、攻撃側との非対称を埋めにいく——これがGlasswingの示した方向です。

Project Glasswing 適用判断チェック

全 4 問

問1
あなたが従業員 100 名の SaaS 企業の CISO で、社内で「AI は攻撃に使われると怖いから、社内のセキュリティ運用に AI を組み込むのは見送ろう」という議論が出ています。本記事の主張に従うと、どう判断すべきか？
解説
本記事は「CloudflareやMozillaの数字を見れば、ログ監視、脆弱性スキャン、フィッシング検知、ふるまい異常検知といった守りの業務にAIを組み込まないと、攻撃側の速度に追いつけません。『AIは攻撃に使われると怖い』という議論に閉じず、自社の守りの現場でも同じAIを使う、という発想転換が必要です」と明示しています。誤答 (2)(3) は攻撃側との非対称が広がる、(4) は人件費だけが膨らみ攻撃側のAI速度には到底追いつきません。
問2
あなたが情シス責任者で、複数の AI セキュリティ製品の選定に入りました。能力比較表ではモデルAが最高性能と書かれています。本記事の主張に従うと、選定の主軸をどこに置くべきか？
解説
本記事は「Glasswing が評価されたのは、能力の高さだけでなく、危険な出力を検知・遮断する仕組みとセットで配布した点です。日本企業がAIを採用する際にも、AIの能力比較表だけを見るのではなく、その配布元がどんなガードレールと運用支援を提供しているかを、選定の主軸に据える必要があります」と明示しています。誤答 (1)(3) はガードレール不在で悪用・暴走時に組織が被害を受けるリスク、(4) は自社環境への適合を考慮しません。
問3
あなたが従業員 30 名の中小企業の情シス担当で、Mythos Preview のような最先端モデルにはアクセスできません。「うちには関係ない話だ」と判断する前に、本記事の主張に従うと取れる現実的な初手は？
解説
本記事は「現実的な初手の例を3つ挙げると、ひとつは自社で内製している管理ツールやAPIのコードを、最新のAIにレビューさせて潜在バグを洗い出すこと。ふたつ目は、社員に届くフィッシングメールの傾向をAIに分析させ、自社向けの注意喚起テンプレートを毎月更新すること。みっつ目は、認証ログ・アクセスログから『いつもと違う振る舞い』をAIに下見させ、人の目を通すべき件を絞り込むこと」と具体例を示しています。誤答 (1)(3) はいずれも具体的な打ち手から目を背ける、(4) は社内の文脈知識を捨てます。
問4
あなたが大手金融機関のセキュリティ責任者で、Anthropic が Mythos Preview を「広く一般公開せず統制配布する」と発表したことに対し、社内の経営会議で「制限せずに広く配ったほうが市場は伸びるのに不合理だ」という意見が出ました。本記事の主張に従うと、どう説明すべきか？
解説
本記事は「選択肢は本来 3 つあります。A. 広く一般公開する (改善は速いが攻撃に転用される)、B. 完全に封鎖する (リスクはないが守る側の改善も止まる)、そして C. 統制配布＋共同検証 (信頼できるパートナーに限定して使わせ、共同で安全策を整備する)。Glasswing は明確に C を選びました」と整理しています。誤答 (1)(3) は攻撃側にも能力を渡すリスクを軽視、(4) は待っている間に攻撃側との非対称が広がる恐れがあります。

はてなベースは、生成AIの「攻めの活用」と「守りの活用」を両輪でご支援します。業務フローへのAIエージェントの組み込み設計、AI活用の土台となる社内データの統合・整理、そして「機微情報を外部に出したくない」企業向けのオンプレミス生成AI導入まで。守りの側でAIを動かし始めるための初手のアセスメントから一緒に設計します。

AI活用と守りの設計を相談する