Claude Mythosだけが危ないのか?AIセキュリティ時代に見落とされがちな本当の論点
最近、チームみらいが煽っているせいか、Claude Mythosの脅威が何となく一人歩きしているようなのを感じる。こういう表現をするとチームみらいをディスっているように見えるがそこはそうではない。煽った方がいい。政府もきちんと動くし、金融機関やインフラ企業・組織にも早めに使って欲しい。
ただ同時に、大きく2点危うさを秘めた動きだと感じる。
まずMythosと同じ意味で危ないAIはMythosだけではないという点、
そして、Mythosを超えるAIが今後もどんどん出てくるということだ。

なぜ、Claude Mythosだけがここまで騒がれているのだろうか。
Anthropicが発表したClaude Mythos Previewは、ソフトウェアの脆弱性を見つけ、場合によっては悪用方法まで組み立てられる高度なAIモデルだ。これだけ聞くと、「危険すぎるAIが出てきた」と感じるのは自然の事だと思う。
ただ、話はもう少し複雑で、OpenAIのGPT-5.5など、他の最先端AIもすでに近い水準のサイバー能力を示しているのだ。問題は「AnthropicのMythosだけが危ない」という単純な話ではなく、AIがサイバーセキュリティの世界に本格的に入り込み、攻撃側にも防御側にも大きな影響を与え始めた、という話なわけだ。
だが重要なのは、いい面悪い面ある。MozillaはAnthropicとの協力により、Firefox 150でClaude Mythos Previewが特定した271件の脆弱性を修正した。AIが危険な能力を持つ一方で、その能力によって自分が使うブラウザが安全になる。ここに、このニュースの難しさと面白さがあるのだ。
Firefox+Thunderbird使いのぼくにとっては、最初の心配と同時に、安心が後から来た感じだ。
そもそも「AIセキュリティ」とは何か
「AIセキュリティ」という言葉には大きく二つの意味がある。
一つは、AIそのものを安全に使うためのセキュリティ。AIが危険な情報を出さないようにする、個人情報を漏らさないようにする、といった話。もう一つは、AIを使ってコンピューターやソフトウェアを守るセキュリティだ。AIがコードを読み、バグや脆弱性を見つけ、修正案を出すような使い方がこれにあたる。
Claude Mythosをめぐる騒動では、この二つが重なっている。Mythosは防御に使えばとても頼もしい存在だが、同じ能力が攻撃者に渡れば、まだ修正されていない弱点を探し、悪用するためにも使われる。専門的にはこうした性質を「デュアルユース」と呼び、包丁が料理にも犯罪にも使えるように、サイバー能力を持つAIも、防御にも攻撃にも使えるということなのだ。
Claude Mythosはなぜ注目されたのか
Claude Mythos PreviewはProject Glasswingという取り組みの中で発表され、これは以前その時のニュースも記事にした。AnthropicはAWS、Apple、Cisco、Google、Microsoftなどと協力し、世界の重要ソフトウェアを守るための取り組みだと説明している。Mythos Previewについては一般公開されていないfrontier modelであり、ソフトウェア脆弱性を見つけ悪用する能力で「最も熟練した人間以外を上回る」水準に達していると述べてもいる。
注目を集めた理由は主に二つある。
第一に、Anthropicが「安全性重視のAI企業」として知られていることだ。同社はもともと「信頼でき、解釈可能で、制御しやすいAIシステムを作る」というイメージを強く持ってる。その会社が「これは危険な能力を持つので一般公開しない」と言えば、社会的な説得力が高くなるというものだ。
第二に、発表の構図が非常に強いメッセージになっていることだ。「危険すぎるので一般公開しない」「ただし、防御のために重要企業やオープンソース関係者には限定提供する」「AIの危険性を正面から認めつつ、守るために使う」——これは「新しい高性能AIが出ました」と言うよりも、はるかに印象に残る。
Anthropicの語り方が巧みであることは否定できまないし、この文脈で批判する人もいる。ただ、「全部マーケティングだ」と切り捨てるのもどうかと思う。
Firefoxの271件の脆弱性修正は一例だが、実際にユーザーに利益をもたらすわけであるから。
Firefoxの271件修正が示すもの
MozillaはFirefox 150で、Claude Mythos Previewによる初期評価を経て特定した271件の脆弱性を修正した。その内訳はsec-highが180件、sec-moderateが80件、sec-lowが11件である。高影響の脆弱性には「十分な努力があれば任意コード実行に悪用され得る」ものも含まれており、修正には実際の防御上の価値がる、というか、sec-highについてはほんと直せてよかった、だと思う。ただし、AIは脆弱性発見してくれたが、この穴を塞ぐのは、まだ人間の役割なのだ(いつまでそうかは解らないが)。今は過渡期というか、入り口というか、いずれにしてもAIがセキュリティの世界を裸にし始めたことだけは確かだ。
「Mythosだけ」という見方は危うい
英国のAI Security Institute(AISI)はOpenAIのGPT-5.5についても評価を行い、「これまで評価した中で最も強力なモデルの一つ」と説明している。GPT-5.5はAISIのマルチステップ・サイバー攻撃シミュレーションをエンドツーエンドで解いた2番目のモデルであり、「The Last Ones」という32ステップの企業ネットワーク攻撃シミュレーションを10回中3回解いている。一方、新しいMythos Previewは同シミュレーションを10回中6回解いており、一部で先行していることは確かである。
しかし重要なのは、複数の最先端モデルがすでに同種の高度なサイバー能力に到達しているという事実だ。問題は「Anthropicだけが危ないモデルである」という話ではなく、AI全体がサイバーセキュリティの専門作業に近づきつつあることなのだ。
OpenAIもこれを認識し、GPT-5.5のサイバー能力を認証済みの防御者向けにより有用にしつつ、悪用リクエストを制限する「Trusted Access for Cyber」という枠組みを発表しているが、Anthropicほどインパクトがない。構図はAnthropicと同じなのに。だからマーケティングと言われてしまうのだ。でもどっちも危ないのだよ。
本当のボトルネックは「発見」から「修正」へ移る
これまでサイバーセキュリティでは、脆弱性を見つけること自体が難しい作業だった。しかしAIがこの作業を高速化すると、ボトルネックが変わる。
これから問題になるのは「脆弱性を見つけられるか」ではなく、「見つかった大量の脆弱性をどう処理するか」ということだ。AIが100件の問題を見つけても、本当に危険なのはどれか、すぐ直すべきものはどれか、直すことで別の不具合が起きないか——こうした判断は、まだ多くの部分で人間と組織の責任になる(何度もいうがいつまでかは解らない)。
WIREDの報道によれば、MozillaのFirefoxチームも、AIが発見する大量のバグに対応するにはリソースと規律が必要だと認めている。大企業は対応できても、小規模なオープンソースプロジェクトの保守者には負担が大きいという懸念も示されている。実際小さなソフトウェア会社やフリーソフトには不可能と言ってもいい。
つまり、AIが発見を加速し、修正と運用んい社会の側が追いつかなければならない。「見つからなければ安全」ではなく、「見つかる前提でどう直すか」が問われる時代に入りつつあるのだ。穴は一つあれば十分かもしれないのだ。
まとめ:Mythosだけを怖がってりゃいいという事ではない
Claude Mythosは間違いなく重要なモデルだ。危険な能力を持ち、防御にも大きく役立つ。Firefoxの271件の脆弱性修正は、その象徴的な事例といえる。
しかし、Mythosだけを特別視するのは現実を単純化しすぎている。今起きているのは、AIがソフトウェアの弱点を見つける能力を持ち始め、その力が防御者にも攻撃者にも使えるという構造的な変化なのだ。大企業は対応できるかもしれないが、小さな開発者やオープンソースプロジェクトは取り残されるかもしれない。一般ユーザーは、その結果として安全になることもあれば、逆に危険にさらされることもある。
一般ユーザーにできることはシンプルだ。ブラウザやOS、アプリを更新する。セキュリティアップデートを軽く見ない。企業や開発者には、AIによる脆弱性発見を前提に、検証・優先順位付け・修正・リリースの体制を見直す必要がある。あとは祈ろう。
より正確に言えば、Claude Mythosはこう位置付けるべきでだ。
AIによって脆弱性の発見速度が人間社会の修正速度を上回り始めているという構造的変化を、わかりやすい形で示した存在である。
これから問われるのは、どのAIが一番危ないかではない。その力を、誰が、どのようなルールで、どちら側のために使うのかということにかかっているのだ。
- Anthropic Project Glasswing
- Anthropic Glasswing initial update
- Mozilla Blog: AI security and zero-day vulnerabilities
- Mozilla Hacks: Behind the scenes hardening Firefox
- Mozilla Security Advisory Firefox 150
- UK AISI: Evaluation of OpenAI GPT-5.5 cyber capabilities
- UK AISI: How fast is autonomous AI cyber capability advancing
- OpenAI: GPT-5.5 with Trusted Access for Cyber
- Reuters: Fears of hacking spurred by Anthropic Mythos overstated
- WIRED: Mozilla used Anthropic’s Mythos to find 271 bugs in Firefox
2026年5月27日 12:32 AM 投稿者: M.A. カテゴリー: AI, AI安全性/危険性, Anthropic, ChatGPT, Claude