Claude Mythosとは?17年前のバグを発見、世界11社にしか渡されないAnthropic最強AIを徹底解説 ‣ はてなベース株式会社

この記事を読むと分かること

Anthropicが2026年4月7日に発表した最先端AI『Claude Mythos(クロード・ミトス)』の正体、Mozilla Firefoxから1度に181個のエクスプロイト可能な脆弱性を引き出した能力、Project Glasswingという特殊な配布プログラムの仕組み、そしてホワイトハウスがアクセス拡大を止めるに至った背景を、専門用語を避けて整理します。Claudeシリーズ(Haiku / Sonnet / Opus)の中での位置づけや、競合のGPT-5.5・Gemini 3.1 Proとの違いも具体的な数字で比較します。

27年もののバグを50ドルで見つけたAI

OpenBSDというOSをご存じでしょうか。世界で最もセキュリティが堅牢と評価されているUnix系OSの一つで、銀行・軍事・通信インフラなどミッションクリティカルな現場で使われ続けてきました。そのOpenBSDのTCPスタックに、27年間誰も気づかなかったバグが眠っていました。ハッカーがたった2つのパケットを送るだけで、稼働中のサーバーをクラッシュさせられるという致命的な欠陥です。

このバグを見つけたのは人間のセキュリティ専門家ではありません。Anthropicが2026年4月に発表した最先端AI『Claude Mythos』です。さらに驚くべきは、発見にかかった具体的なコストです。Anthropicによると、このバグを発見した個別の実行コストは50ドル足らず。AIに『OpenBSDを調べて』と指示してから、致命的なバグが報告されるまでに発生したクラウド利用料が、わずか数千円ということです。

Claude Mythosが見つけたものの一例

27年もののOpenBSD TCPスタックバグ(2つのパケットでサーバーをクラッシュ可能) / 17年もののFreeBSD遠隔コード実行脆弱性(CVE-2026-4747、NFS経由でroot権限奪取) / Mozilla Firefoxから181個のエクスプロイト可能な脆弱性 / うち29個はメモリ書き換え制御まで成功 / 主要OS・主要ブラウザに対しては『数千件のゼロデイ』を発見したとAnthropicが公表。

FreeBSDの17年もののRCE脆弱性(CVE-2026-4747)に至っては、AIが攻撃コードまで自動で書き上げました。Mythosは脆弱性を発見しただけでなく、それを悪用するエクスプロイトコードまで自力で作り出したのです。Firefoxには181個の働くエクスプロイト、29個についてはメモリ書き換えのコントロールまで奪う段階に到達しました。これらの結果は、UK政府が運営するAI Safety Institute(AISI)による独立評価でも追認されています。

Claude Mythosとは何か — 3行で言うと

話題の中心にあるClaude MythosとはどんなAIなのか、まず3行で整理します。

Claude Mythosの3行まとめ

(1) Anthropic(『Claude』を作っている米国のAI企業)が2026年4月7日に発表した最先端AI。 (2) 普通の用途にも使えるが、特にサイバーセキュリティの脆弱性発見能力が異常に高い。 (3) 危険すぎるため一般公開されず、世界11社+約40の重要インフラ事業者だけがアクセス可能な『Project Glasswing』というプログラム経由でのみ提供される。

ポイントは『一般公開されていない』ことです。ChatGPTやClaude.aiのように、月額契約で誰でも触れるという形では提供されていません。AWS、Apple、Google、Microsoft、JPMorgan Chaseなど、世界でも限られた組織だけがアクセス権を持ち、その権限はAnthropicとの個別契約と用途審査を経て付与されます。ホワイトハウスは、Anthropicがこのアクセス対象を50社から120社に拡大しようとした計画にストップをかけたと報じられています。Anthropicが提供する一般向けモデルの全体像はClaude全モデル比較ガイドもあわせてご覧ください。

なんでそんなにすごいの? — 数字で見る能力

『最強』と言われても抽象的すぎるので、Claude Mythosが各種ベンチマークで出している数字を具体的に見ていきます。同じテストを既存のClaude Opus 4.7や、競合のGPT-5.5・Gemini 3.1 Proも受けています。

ベンチマーク	内容	Claude Mythos のスコア
SWE-bench Verified	実在のソフトウェアバグを自力で修正できるか測るテスト	93.9% (世界トップ水準)
SWE-bench Pro	より難易度の高い実プロジェクト課題	77.8%
Terminal-Bench 2.0	ターミナル上で複数手順をこなす総合エージェント能力	82.0%
USAMO 2026	米国数学オリンピックの問題セット	97.6%
CTF Expert	セキュリティ専門家向けの実技テスト(2025年4月以前は全AIが0点だった分野)	73% (Mythos以前は到達不能領域)
The Last Ones	32ステップの企業ネットワーク侵入シミュレーション	10回中3回完全クリア(史上初)

UK AISIが運営する『The Last Ones』というベンチマークは特に重要です。これは人間の熟練セキュリティ専門家でも20時間かけてようやく終わる32段階の企業ネットワーク攻撃シミュレーションで、Claude Mythos以前はどのAIも完全クリアできませんでした。Mythosは10回挑戦して3回、完全に最後までやり通しました。同じテストでGPT-5.5は10回中2回。Claude Opus 4.6は平均で16ステップしか進めず、最終ゴールには届きませんでした。

イメージしやすい言い方をすると、普通のセキュリティスキャナーがウイルス対策ソフトレベルだとすれば、Claude Mythosは『一流ホワイトハッカーチーム』をAIで再現したようなものです。しかも疲れないし、24時間動き続けます。Anthropicの最高技術責任者(CTO)はMythosの能力を『エリート級セキュリティ研究者と同等』と評しています。

なぜAnthropicは公開しないのか — 危険すぎる3つの理由

これほど強力なAIなら、世界中の企業が欲しがるはずです。それでもAnthropicは一般公開を選びませんでした。理由はシンプルで、『同じ能力のAIが攻撃側の手に渡ったら、防御側が追いつかなくなる』からです。

Anthropicは『Project Glasswing(プロジェクト・グラスウィング)』という限定配布プログラムを立ち上げ、選ばれた11社+約40の重要インフラ事業者だけにMythosを提供しています。表向きの目的は『重要なソフトウェアを守る側に、攻撃側より先に最強の道具を渡す』ことです。

参加企業	業種	想定される役割
AWS	クラウド基盤	クラウドインフラの脆弱性発見
Apple	プラットフォーマー	iOS / macOSのセキュリティ強化
Broadcom	半導体・通信	ハードウェア層のセキュリティ
Cisco	ネットワーク機器	ネットワーク機器の脆弱性発見
CrowdStrike	サイバーセキュリティ専業	防衛側の最前線
Google	プラットフォーマー	Android / Chrome / Gmailの強化
JPMorgan Chase	大手金融	金融インフラの防衛
Linux Foundation	OSS基盤	Linuxカーネル等の堅牢化
Microsoft	プラットフォーマー	Windows / Azureの強化
NVIDIA	AI半導体	AIインフラの安全性
Palo Alto Networks	セキュリティ専業	防衛側ツールへの統合

11社の顔ぶれを見ると、クラウド事業者・OSベンダー・大手金融・通信機器メーカー・セキュリティ専業ベンダーが揃っています。世界のインターネットを動かす土台になっている企業群で、ここを最初に固めれば連鎖的に世界中のシステムが守られるという論理です。さらに約40の重要インフラ事業者(電力・水道・医療等)もアクセス対象に含まれます。

Anthropicは$100Mの利用クレジット枠を用意し、OpenSSFやApache Software Foundationなどオープンソース基盤に対しても合計$4M(約6億円)の支援を表明しています。発見した脆弱性は90日ごとに公開レポートで報告する仕組みも組み込まれています。一方で、EU・中国へは提供拒否、日本企業は1社も入っていません。米英主導の選定基準が透けて見えます。

そして印象的なのが、ホワイトハウスがAnthropicのアクセス拡大計画を止めた件です。Anthropicは2026年中にこのアクセス対象を50社から120社へ広げる予定を持っていましたが、米政府の介入で計画は保留になったと複数のメディアが報じています。それだけMythosは『国家安全保障に関わる能力』として扱われているということです。

Mythosは『Claude』シリーズの中でどこに位置するのか

Anthropicが公開している『Claude』シリーズには、用途別に3つの選択肢があります。軽量で安価な『Haiku』、汎用バランス型の『Sonnet』、最高性能の『Opus』です。2026年5月時点の最新版はそれぞれHaiku 4.5・Sonnet 4.6・Opus 4.7。法人・個人を問わず、契約すれば誰でも触れます。

Claude Mythosは、この3兄弟の上に位置する『研究プレビュー』扱いです。性能はOpus 4.7を超えますが、一般公開はされません。価格設定も特殊で、入力トークン100万あたり25ドル、出力トークン100万あたり125ドルと、Opus 4.7($5/$25)の5倍です。

モデル	立ち位置	価格(入力/出力 per M tokens)	一般公開
Claude Haiku 4.5	軽量・高速	$1 / $5	あり(誰でも)
Claude Sonnet 4.6	汎用バランス型	$3 / $15	あり(誰でも)
Claude Opus 4.7	最高性能(一般公開モデル)	$5 / $25	あり(誰でも)
Claude Mythos Preview	研究プレビュー(Glasswing限定)	$25 / $125	なし(11社+α限定)

つまり、普段ChatGPT感覚でClaudeを使っている読者の方が触れているのはOpus 4.7までで、Mythosはその上の『普通の人は触れない別物』ということになります。同じAnthropicのモデルでも、配布戦略がまったく違うことを押さえておきましょう。各モデルの料金体系の詳細はClaude料金プラン完全ガイドに整理しています。エンタープライズ向けに別系統で展開されている『Claude Security』の動向はAnthropic、企業向け『Claude Security』をパブリックベータで公開で詳述しています。

Mythosは何のために使われているのか — 実際のユースケース

Glasswing参加企業がMythosを何に使っているか、報じられている事例を整理します。

Mozilla / Firefox: 1回の評価でFirefoxから271件の脆弱性を発見。Firefox 150の緊急アップデートで、180件のsec-highと80件のsec-moderateがパッチされた。Mozillaは『AIによる脆弱性発見は防御側にとって希望』とコメントを発表
FreeBSD / OpenBSD: それぞれ17年もの・27年もののバグを自律発見。発見にかかったクラウド利用料は数千円から数万円レベル
重要インフラ事業者(約40社): 電力・水道・医療等のシステムに対してMythosを動かし、ゼロデイ脆弱性を事前発見してパッチ
Linux Foundation / Apache Software Foundation: オープンソース基盤の脆弱性発見にMythosを活用。Anthropicから$4M(約6億円)の財政支援を受けて運用

Mozillaの事例は特に象徴的です。世界で1億人以上が使うWebブラウザに対して、AIが1回スキャンしただけで271件のセキュリティホールを引きずり出しました。180件はsec-highという深刻度の高いもので、悪意あるWebサイトを訪問するだけで被害が出るレベルです。Mozillaのセキュリティチーム史上、過去最多級の発見数となりました。

Anthropicは『発見した脆弱性は90日ごとに公開レポートにまとめる』というコミットメントも出しています。透明性を確保することで、防御側コミュニティ全体に知見をシェアし、Mythosが攻撃側に流出した場合の被害を最小化するという狙いです。

他社の最先端AIとの違い — GPT-5.5 / Gemini 3.1 Pro と比べると

Claude Mythosが『最強』と言われる一方で、OpenAIのGPT-5.5やGoogleのGemini 3.1 Proといった競合も2026年4月から5月にかけて重要なアップデートを重ねています。UK AISIの評価では、サイバーセキュリティ領域でMythosとGPT-5.5は接戦になっています。

項目	Claude Mythos	GPT-5.5	Gemini 3.1 Pro	Claude Opus 4.7
SWE-bench Verified	93.9% (1位)	非公表	非公表	概ね同等水準
CTF Expert	73%	71.4%	非公表	中位
The Last Ones (32ステップ)	3/10完全クリア	2/10完全クリア	未到達	未到達
一般公開	なし(11社+α限定)	あり(API公開)	あり(API公開)	あり
価格(出力 per M tokens)	$125	公開水準で利用可能	公開水準で利用可能	$25

性能面で見るとMythosとGPT-5.5は拮抗しています。CTF expertという専門家向けテストで73%対71.4%、企業ネットワーク侵入シミュレーションで3/10対2/10と、僅差です。違いは『どちらが手に届くか』に集約されます。GPT-5.5はAPIで誰でも従量課金で使えますが、Mythosは契約11社+一部重要インフラ以外には開放されていません。

実務的に言えば、企業のセキュリティ担当者が今すぐ手にできる『脆弱性発見AI』としてはGPT-5.5が現実的な選択肢です。一方で、Mythosの存在は『AIによる脆弱性発見の天井』を引き上げ続けており、その天井に追従するモデルが今後OSSや他社からも出てくることを暗示しています。GPT-5.5とClaudeをどう実務で使い分けるかはGPT-5.5 vs Claude Opus 4.7 実装現場で見えた判断軸で具体的に整理しています。

まとめ — Mythosが作った『脅威か機会か』の分かれ目

Claude Mythosが私たちに見せたのは、AIが27年もののOSのバグを数千円のコストで見つけ出す世界が、もう始まっているという事実です。要点を整理します。

Claude MythosはAnthropicが2026年4月に発表したフロンティアAI。サイバーセキュリティ領域で人類が到達できなかった性能を実現
OpenBSDで27年・FreeBSDで17年見逃されていたバグを、AIが自律的に発見・エクスプロイトまで作成
Firefoxに対しては1回の評価で271件の脆弱性、うち181件はエクスプロイト可能と判明
危険すぎるため一般公開されず、Project Glasswing経由で11社+約40の重要インフラ事業者だけに限定提供
ホワイトハウスはアクセス拡大計画(50社→120社)を保留にさせるなど、安全保障案件として扱われている
競合のGPT-5.5はAISI評価でMythosに肉薄。性能の天井は確実に押し上がっている

ここで気になる読者の方が多いはずです。世界11社しか触れないこのAI、本当に普通の人には完全に手が届かないのか、と。実は2026年4月、たった一人でその壁を突破した若者が現れました。フロリダ在住・22歳・高校中退の独学エンジニアです。彼は公開されている論文を読み込み、推測だけでMythosのアーキテクチャを再構築。GitHubに『OpenMythos』として公開してしまったのです。次回はその衝撃の物語を追います。

AIの最新動向を経営判断に活かすために

Claude Mythosのようなフロンティアモデルは、半年で一般公開モデルに追従されていく流れにあります。自社のAI調達・業務組み込みをどこから始めるか、はてなベースが伴走支援します。AIエージェントの業務組み込み、オンプレミス生成AI構築、AIセキュリティ運用設計まで、まずは30分の無料相談からどうぞ。

30分無料相談を申し込む