2026年4月7日、アメリカのAI企業Anthropicが最新モデル「Claude Mythos(クロード ミソス)」を発表して話題になりました。Claude Mythosはコーディングや多言語対応、サイバーセキュリティなどのベンチマークでほかのモデルを上回るスコアを記録した最上位モデルです。
しかし、以下のような疑問をもつ方もいるでしょう。
「Claude Mythosはどのような特徴をもつのか、ほかのAIモデルと比較したい」
「Claude Mythosはなぜ一般公開されていないのかわからない」
そこで今回は、Claude Mythosの特徴や詳しいベンチマークスコア、一般公開されない理由などをわかりやすく解説します。
【記事を読んで得られること】
- Claude Mythosの特徴やほかモデルとのベンチマーク比較
- Claude Mythosが一般公開されない理由とProject Glasswingの内容
- Claude Mythosに対するテック界隈の反応
現時点でわかっているClaude Mythosの情報を網羅的にまとめているので、気になる方は参考にしてください。
Claude Mythosとは

Claude Mythosとは、2026年4月7日にアメリカのAnthropic社によって発表された最上位のAIモデルです。コーディングスキルや多言語対応力に加え、ソフトウェアの脆弱性を発見・悪用する能力がきわめて高いモデルで、その危険性から一般公開はされていません。
「Mythos」は「神話」を意味する単語で、これまでのAnthropicのフラッグシップモデルであるOpusシリーズを超える、まったく新しいモデルとして位置づけられています。
Claude Mythosは、「Project Glasswing」と呼ばれるプロジェクトを通じて一部のパートナー企業のみに提供されています。非公開の理由やProject Glasswingの詳細については後述します。
Claude Mythosの特徴3選

Anthropicの最上位モデルであるClaude MythosはどのようなAIモデルなのでしょうか。ここでは、Claude Mythosの特徴を3つに分けて解説します。
- 驚異的なベンチマークスコア
- サイバーセキュリティの攻撃能力の高さ
- 一般には非公開
それぞれ、わかりやすく解説します。
驚異的なベンチマークスコア
Claude Mythosは、コーディングや推論、対応言語の多さなど幅広い領域で前世代モデルのOpus 4.6を大きく上回る結果を出しました。

Anthropicは公式サイトで、「AIモデルは、ソフトウェアの脆弱性を発見・悪用する能力において、最高度のスキルをもつ一部の人間を除き、ほぼすべての人間を凌駕するレベルに到達した」と述べています。
一方で、その能力があまりに高いため、悪意ある第三者に悪用された場合の脅威も懸念されています。
サイバーセキュリティの攻撃能力の高さ
Claude Mythosがとくに注目される理由は、突出したサイバーセキュリティの攻撃能力です。
Anthropicが正式にリリースする前におこなった安全評価で、主要なOSやWebブラウザ全体で数千件規模の深刻な脆弱性をClaude Mythosが発見しました。さらに脆弱性の発見にとどまらず、それを悪用する攻撃コード(エクスプロイト)を自律的に生成し、実際に攻撃する能力も確認されています。
Anthropicの安全評価チーム責任者であるLogan Grahamは、複数の脆弱性を組みあわせてより高度な攻撃を自律的に組み立てるその能力を「これまでのモデルにはない特性だ」とNBC Newsに語っています。
参照:NBC NEWS「Why Anthropic won’t release its new Claude Mythos AI model to the public」
一般には非公開
先ほど述べたとおり、Claude Mythosはサイバー攻撃に悪用されるリスクが高すぎるという理由で一般公開が見送られました。
Anthropicは公式サイトで「経済・公共の安全・国家の安全保障への深刻な影響が生じる恐れがある」と危機感を表明しています。現時点では一部の指定されたテック関連企業に限定した提供にとどまりました。
We do not plan to make Mythos Preview generally available. Our goal is to deploy Mythos-class models safely at scale, but first we need safeguards that reliably block their most dangerous outputs.
— Anthropic (@AnthropicAI) April 7, 2026
We’ll begin testing those safeguards with an upcoming Claude Opus model.
上のXの投稿にあるように、Anthropicは将来的にMythosクラスのモデルを安全に公開することを目標としています。しかし、その実現にはもっとも危険な出力を確実に遮断できる新たな安全策の開発が必要だと説明しています。
Claude Mythosの実力を示すベンチマーク5つ

ここでは、Claude Mythosが記録したベンチマークのなかから主要な5つを紹介します。
- CyberGym
- GPQA Diamond
- Humanity’s Last Exam
- OSWorld-Verified
- SWE-bench Verified
各ベンチマークが何を示す指標なのかもあわせて解説します。
CyberGym
CyberGymは、AIのサイバーセキュリティ能力を測るベンチマークです。実際のソフトウェアに存在した1,507件の脆弱性をもとに、AIが脆弱性を再現する攻撃コードを自律的に生成できるかどうかを評価します。

参照:ANTHROPIC「Project Glasswing」
Claude MythosのCyberGymスコアは83.1%で、前世代モデルのOpus 4.6の66.6%を16.5ポイント上回りました。現時点で最高スコアを記録しており、Anthropicはこの結果を、Mythosのサイバーセキュリティ能力がOpus 4.6と大きな差があると説明しています。
GPQA Diamond
GPQA Diamondは、生物・化学・物理学の博士レベルの専門知識を問う難解な試験です。専門知識のない人がインターネット検索だけでは正解を見つけられないよう設計されており、博士号の保持者でも正答率は約65〜70%と言われています。

参照:ANTHROPIC「Project Glasswing」
Claude MythosのGPQA Diamondスコアは94.6%で人間の専門家を大きく上回り、かつ前世代モデルのOpus 4.6(91.3%)も上回る記録です。
これは、博士レベルの科学的推論においてもClaude Mythosが高い水準の性能をもっているといえます。
Humanity’s Last Exam
Humanity’s Last Examは、数学・人文科学・自然科学など100以上の分野にわたる2,500問の問題で構成されるベンチマークです。既存のベンチマークでは主要AIモデルが軒並み高得点を記録し、差がつきにくくなった状況を受けて2025年1月に新しく登場したベンチマークです。

参照:ANTHROPIC「Project Glasswing」
Claude MythosはHumanity’s Last Examにおいて、ツールなし*で56.8%、ツールあり*で64.7%を記録しました。前世代モデルのOpus 4.6(ツールなし40.0%、ツールあり53.1%)を大幅に上回っており、最高難度の学術的問題でも突出した推論能力をもっています。
*ツールなし:AIが学習データとして持っている内部の知識と、自身の推論能力だけで回答する場合
*ツールあり:AIが自身のデータに加えWeb検索や専門データベースなどを使いながら回答する場合
OSWorld-Verified
OSWorld-Verifiedは、AIが実際のコンピューター画面を見ながら、クリックやタイピングなど人間と同じ操作でソフトウェアを使いこなせるかを評価するベンチマークです。
ファイル操作やアプリの設定、複数アプリにまたがる作業など、実際に人間がおこなう操作に近いタスクへの対応力を測ります。

参照:ANTHROPIC「Project Glasswing」
Claude MythosのOSWorld-Verifiedスコアは79.6%で、前世代モデルのOpus 4.6が記録した72.7%を上回り、またGPT-5.4の75.0%も超えました。AIが実際にパソコンを操作して業務をこなす能力においても、Claude Mythosが最高水準にあります。
SWE-bench Verified
SWE-bench Verifiedは、GitHubに実際に投稿されたバグ報告をもとに、AIがコードを修正できるかを評価するベンチマークです。実際の開発業務に近い形式で評価できるとして、業界で広く使われています。

参照:ANTHROPIC「Project Glasswing」
Claude MythosのSWE-bench Verifiedスコア93.9%はOpus 4.6(80.8%)を約13ポイント上回っており、実務レベルのソフトウェアエンジニアリング能力を備えていることがわかります。
Claude Mythosが発見した脆弱性の実例

ここでは、Claude Mythosが性能テストで実際に発見した脆弱性の例を3つ紹介します。
- OpenBSD
- FFmpeg
- FreeBSD
それぞれ、詳しく解説します。
OpenBSD
OpenBSDとは、世界の重要インフラの運用に広く使われており、屈指のセキュリティ強度を誇るオープンソースのOSです。Claude Mythosはそのような堅牢なシステムで27年間誰にも発見されなかった脆弱性を自律的に発見しました。
この脆弱性を悪用されると、攻撃者はOpenBSDが稼働しているマシンにアクセスするだけで、そのマシンを遠隔操作でシステム不全にすることができます。Anthropicは発見後にOpenBSDの管理者に報告し、現在は修正済みです。
FFmpeg
FFmpegは動画や音声の変換・処理に使われるソフトウェアで、世界中の多くのアプリやサービスの基盤として組み込まれています。Claude MythosはそのFFmpegのシステムで16年間見逃されてきた脆弱性も発見しています。
注目すべきは、その脆弱性が潜んでいたコードは自動のテストツールによってすでに500万回もテストされていたにもかかわらず、一度も検出されなかった点です。
長年にわたって見逃されていた欠陥をClaude Mythosがわずかな時間で指摘したのは、既存のセキュリティ対策の限界を示しているといえるでしょう。
FreeBSD
主要なサーバーやネットワーク機器に広く使われているオープンソースOSのFreeBSDで、17年間気付かれなかったリモートコード実行の脆弱性が潜んでいました。
この脆弱性の恐ろしい点は、悪用した場合の被害の大きさです。インターネット上のどこにいる攻撃者でも、対象サーバーへの認証なしで完全な管理者権限を取得できてしまうため、システムを自由に操作される危険性があります。
さらには、Claude MythosがこのFreeBSDの脆弱性を発見から悪用まで人間の介入ゼロで自律的におこなったとAnthropicの公式ブログに明記されています。
Claudeのほかのモデルとの比較

これまでAnthropicから発表されたモデルのベンチマークを以下の表にまとめました。
| Claude Mythos | Opus 4.6 | Sonnet 4.6 | |
|---|---|---|---|
| CyberGym | 83.1% | 66.6% | – |
| GPQA Diamond | 94.6% | 91.3% | 89.9% |
| Humanity’s Last Exam(with tools) | 64.7% | 53.1% | – |
| OSWorld-Verified | 79.6% | 72.7% | 72.5% |
| SWE-bench Verified | 93.9% | 80.8% | 79.6% |
| Terminal-Bench 2.0 | 82.0% | 65.4% | 59.1% |
上記3つのモデルを比べると、Sonnet 4.6から着実に各種ベンチマークのスコアが伸びています。また、Claude MythosとOpus 4.6を比べると、Claude Mythosのスコアが飛び抜けて高いのも明らかです。
Claude Mythosがほかモデルとは異なる次元の性能をもつモデルということが表からもわかるでしょう。
Project Glasswingの始動

AnthropicはClaude Mythosを一般に公開しないと発表したと同時に、「Project Glasswing(プロジェクト グラスウィング)」という新規プロジェクトを始動させています。
このプロジェクトに関する以下の情報にまとめました。
- セキュリティ防衛に取り組むプロジェクト
- パートナー企業にのみ提供
- 取組結果の公表を予定
セキュリティ防衛に取り組むプロジェクト
Project Glasswingとは、Claude Mythosの高いサイバーセキュリティ能力をセキュリティ防衛に活用するため、Anthropicが立ち上げたプロジェクトです。すでに一般に広く利用されているソフトウェアの脆弱性を発見・修正することを目的としています。
Anthropicが定めたアメリカの企業12社が参画しており、各社がClaude Mythosを使って自社サービスの脆弱性やセキュリティの改善に取り組んでいます。
パートナー企業にのみ提供
Claude Mythosが提供されているテック系企業12社は以下のとおりです。
- Amazon Web Services
- Anthropic
- Apple
- Broadcom
- Cisco
- CrowdStrike
- JPMorganChase
- Linux Foundation
- Microsoft
- NVIDIA
- Palo Alto Networks
Anthropicはこのプロジェクトに対して最大1億ドル分のクレジットを提供するほか、オープンソースのセキュリティ団体へ400万ドルの寄付もしています。
取組結果の公表を予定
Project Glasswingは現在も進行しています(2026年4月末時点)。Anthropicによれば、Project Glasswingが発表された4月7日から90日以内に取り組みの成果が公表される予定です。

参照:ANTHROPIC「Project Glasswing」
公表内容には、新たに発見・修正された脆弱性や、Project Glasswingを通して得られた知見、今後の公開に関する情報などが発表される可能性があります。
一般公開されていない最上位のモデルについてAnthropicからどのような情報が明かされるのか、続報が待たれます。
Claude Mythosに対する社会の反応

Claude Mythosはまだ一般には利用できないモデルのため、不明点が多くあります。Claude Mythosに対してAI界隈はどのような反応をしているのでしょうか。
Claude Mythosに関する著名人・団体の意見をまとめました。
- Anthropic公式「超人的なシステムに憂慮」
- Yann LeCun(Meta 元チーフAIサイエンティスト)「誇張されすぎ」
- JD Vance(米国副大統領)「Mythos公開前にCEOを招集」
Anthropic公式「超人的なシステムに憂慮」
Claude Mythosの公開にあたり、Anthropicは244ページにおよぶ報告書(System Card: Claude Mythos Preview)を公開しました。
そのなかでAnthropicは、「業界全体で十分な安全策が整わないまま、超人的なシステムの開発へ急速に突き進もうとしている状況に強い懸念を感じている」と危機感を示しています。

これは、AIの安全性を重視するAnthropicが、Claude MythosをはじめとするAIモデルが凄まじいペースで開発されていることに対して警鐘を鳴らしたものです。AIの安全対応が現在の開発ペースに追いついていないという問題提起でもあるでしょう。
Yann LeCun(Meta 元チーフAIサイエンティスト)「誇張されすぎ」
Meta社の元チーフAIサイエンティストであるYann LeCun(ヤン・ルカン)氏は、Claude Mythosに対し「Mythos drama = BS from self-delusion(Claude Mythosをめぐる騒動は妄想によるたわごとだ)」とXに投稿し、Anthropicの発表が誇張されすぎていると主張しています。
LeCun氏はかねてよりLLMの限界を主張しており、今回の発言もその延長にあるといえるでしょう。Claude Mythosの評価をめぐっては業界内でも意見が分かれており、最新AIの情報に触れる際はさまざまな立場の意見を参考にしながら冷静に判断する姿勢が大切です。
JD Vance(米国副大統領)「Mythos公開前にCEOを招集」
Claude Mythosの正式発表に先立ち、アメリカのヴァンス副大統領とベッセント財務長官は、以下の主要テック企業のCEOを電話会議に招集しました。
- Anthropic ダリオ・アモデイ氏
- OpenAI サム・アルトマン氏
- Google スンダー・ピチャイ氏
- Microsoft サティア・ナデラ氏
- xAI イーロン・マスク氏
会議ではAIモデルのセキュリティリスクや、AIを悪用したサイバー攻撃への対応が話し合われました。
アメリカ政府がClaude Mythosの公開前からCEOを招集して対応を協議した背景には、Claude Mythosが国家安全保障レベルの脅威として認識されているともいえるでしょう。
Claude Mythosなど注目のAI情報をチェックしよう

本記事では、Claude Mythosの特徴やベンチマークスコア、脆弱性の発見事例、新たに始動したProject Glasswingなどについて解説しました。
Claude Mythosは、その能力の高さと危険性から一般公開が見送られる異例の対応がとられています。一方でその能力を疑問視する声もあり、今後どのような情報が出されるのかが注目されます。
【Claude Mythosのポイント】
- Claude Mythosはあらゆるベンチマークで最高水準を記録している
- サイバー攻撃能力が高いことを理由に一般公開されていない
- アメリカ政府が国家安全保障レベルの脅威として認識している
Anthropicは2026年7月前半ころまでにProject Glasswingの取り組み結果を公表する予定です。
AIスキルの習得を考えている場合は、最大75%の研修費を助成金で削減できる生成AI研修サービスも検討してみてください。



