Claude Mythosとは？特徴3選や一般公開されない理由をわかりやすく解説

April 29, 2026

2026年4月7日、アメリカのAI企業Anthropicが最新モデル「Claude Mythos（クロードミソス）」を発表して話題になりました。Claude Mythosはコーディングや多言語対応、サイバーセキュリティなどのベンチマークでほかのモデルを上回るスコアを記録した最上位モデルです。

しかし、以下のような疑問をもつ方もいるでしょう。

「Claude Mythosはどのような特徴をもつのか、ほかのAIモデルと比較したい」

「Claude Mythosはなぜ一般公開されていないのかわからない」

そこで今回は、Claude Mythosの特徴や詳しいベンチマークスコア、一般公開されない理由などをわかりやすく解説します。

【記事を読んで得られること】

Claude Mythosの特徴やほかモデルとのベンチマーク比較
Claude Mythosが一般公開されない理由とProject Glasswingの内容
Claude Mythosに対するテック界隈の反応

現時点でわかっているClaude Mythosの情報を網羅的にまとめているので、気になる方は参考にしてください。

監修者

株式会社エヌイチ代表取締役 CEO
奥山幸生

株式会社エヌイチ代表取締役｜AIを駆使して法人1期目年商5.5億円達成｜AI×マネタイズジャンルで日本一のYouTube「AI収益化ラボ」の登録者5.6万人超｜国内最大級のChatGPTスクール「ChatGPT道場」の受講者3300人超｜AI人材を育てるプロ

＼　「業務効率を10倍にする現場ですぐ使えるプロンプト20選」を特別配布中！　／

【経営者・事業責任者の方へ】
なぜ、あなたの会社の生産性は上がらないのか？

「現場は頑張っているが、会社全体の生産性が期待したほど上がらない…」
もし、そう感じているなら、原因は次のようなものではないでしょうか。

定型業務に時間を奪われ、付加価値の高い仕事に集中できていない
生成AIを導入したが、一部の社員が使うだけで組織的な活用につながっていない
営業担当者のスキルにバラつきがあり、成果が属人化してしまっている
SNSマーケティングや資料作成に、未だに多くの人手と時間を費やしている
部門間の連携が滞り、気づけば無駄な会議や手戻りが発生している

これらの課題は、AIを「個人」の便利ツールとして放置し、「組織」の武器として活用できていないことが原因です。
多くの企業が「最適な活用法が分からない」「AI活用が個人任せ」という壁にぶつかり、AI導入の効果を最大化できずにいます。

株式会社エヌイチでは、AI活用の専門家として、“個人任せ”のAI活用を、“組織の成果”に変えるご支援をしてきました。

とくに「オンボーディングの高速化」「営業プロセスの標準化」「バックオフィス業務の自動化」といった分野で、企業変革を実現してきた実績がございます。

今回、そのノウハウを結集し、明日から現場ですぐに使える「成果実証済みのプロンプト20選」をご用意しました。

「AI活用」を机上の空論で終わらせずに、確かな成果を出すために。
指示の出し方一つで会社の生産性が劇的に変わるという事実を、まずはこちらの資料で体感してみませんか？

＼　「業務効率を10倍にする現場ですぐ使えるプロンプト20選」を無料で受け取る　／

Claude Mythosとは

Claude Mythosとは、2026年4月7日にアメリカのAnthropic社によって発表された最上位のAIモデルです。コーディングスキルや多言語対応力に加え、ソフトウェアの脆弱性を発見・悪用する能力がきわめて高いモデルで、その危険性から一般公開はされていません。

「Mythos」は「神話」を意味する単語で、これまでのAnthropicのフラッグシップモデルであるOpusシリーズを超える、まったく新しいモデルとして位置づけられています。

Claude Mythosは、「Project Glasswing」と呼ばれるプロジェクトを通じて一部のパートナー企業のみに提供されています。非公開の理由やProject Glasswingの詳細については後述します。

Claude Mythosの特徴3選

Anthropicの最上位モデルであるClaude MythosはどのようなAIモデルなのでしょうか。ここでは、Claude Mythosの特徴を3つに分けて解説します。

Claude Mythosの特徴3選

驚異的なベンチマークスコア
サイバーセキュリティの攻撃能力の高さ
一般には非公開

それぞれ、わかりやすく解説します。

驚異的なベンチマークスコア

Claude Mythosは、コーディングや推論、対応言語の多さなど幅広い領域で前世代モデルのOpus 4.6を大きく上回る結果を出しました。

Anthropicは公式サイトで、「AIモデルは、ソフトウェアの脆弱性を発見・悪用する能力において、最高度のスキルをもつ一部の人間を除き、ほぼすべての人間を凌駕するレベルに到達した」と述べています。

一方で、その能力があまりに高いため、悪意ある第三者に悪用された場合の脅威も懸念されています。

サイバーセキュリティの攻撃能力の高さ

Claude Mythosがとくに注目される理由は、突出したサイバーセキュリティの攻撃能力です。

Anthropicが正式にリリースする前におこなった安全評価で、主要なOSやWebブラウザ全体で数千件規模の深刻な脆弱性をClaude Mythosが発見しました。さらに脆弱性の発見にとどまらず、それを悪用する攻撃コード（エクスプロイト）を自律的に生成し、実際に攻撃する能力も確認されています。

Anthropicの安全評価チーム責任者であるLogan Grahamは、複数の脆弱性を組みあわせてより高度な攻撃を自律的に組み立てるその能力を「これまでのモデルにはない特性だ」とNBC Newsに語っています。

参照：NBC NEWS「Why Anthropic won’t release its new Claude Mythos AI model to the public」

一般には非公開

先ほど述べたとおり、Claude Mythosはサイバー攻撃に悪用されるリスクが高すぎるという理由で一般公開が見送られました。

Anthropicは公式サイトで「経済・公共の安全・国家の安全保障への深刻な影響が生じる恐れがある」と危機感を表明しています。現時点では一部の指定されたテック関連企業に限定した提供にとどまりました。

We do not plan to make Mythos Preview generally available. Our goal is to deploy Mythos-class models safely at scale, but first we need safeguards that reliably block their most dangerous outputs.

We’ll begin testing those safeguards with an upcoming Claude Opus model.
— Anthropic (@AnthropicAI) April 7, 2026

上のXの投稿にあるように、Anthropicは将来的にMythosクラスのモデルを安全に公開することを目標としています。しかし、その実現にはもっとも危険な出力を確実に遮断できる新たな安全策の開発が必要だと説明しています。

Claude Mythosの実力を示すベンチマーク5つ

ここでは、Claude Mythosが記録したベンチマークのなかから主要な5つを紹介します。

Claude Mythosの実力を示すベンチマーク5つ

CyberGym
GPQA Diamond
Humanity’s Last Exam
OSWorld-Verified
SWE-bench Verified

各ベンチマークが何を示す指標なのかもあわせて解説します。

CyberGym

CyberGymは、AIのサイバーセキュリティ能力を測るベンチマークです。実際のソフトウェアに存在した1,507件の脆弱性をもとに、AIが脆弱性を再現する攻撃コードを自律的に生成できるかどうかを評価します。

参照：ANTHROPIC「Project Glasswing」

Claude MythosのCyberGymスコアは83.1%で、前世代モデルのOpus 4.6の66.6%を16.5ポイント上回りました。現時点で最高スコアを記録しており、Anthropicはこの結果を、Mythosのサイバーセキュリティ能力がOpus 4.6と大きな差があると説明しています。

GPQA Diamond

GPQA Diamondは、生物・化学・物理学の博士レベルの専門知識を問う難解な試験です。専門知識のない人がインターネット検索だけでは正解を見つけられないよう設計されており、博士号の保持者でも正答率は約65〜70%と言われています。

参照：ANTHROPIC「Project Glasswing」

Claude MythosのGPQA Diamondスコアは94.6%で人間の専門家を大きく上回り、かつ前世代モデルのOpus 4.6（91.3%）も上回る記録です。

これは、博士レベルの科学的推論においてもClaude Mythosが高い水準の性能をもっているといえます。

Humanity’s Last Exam

Humanity’s Last Examは、数学・人文科学・自然科学など100以上の分野にわたる2,500問の問題で構成されるベンチマークです。既存のベンチマークでは主要AIモデルが軒並み高得点を記録し、差がつきにくくなった状況を受けて2025年1月に新しく登場したベンチマークです。

参照：ANTHROPIC「Project Glasswing」

Claude MythosはHumanity’s Last Examにおいて、ツールなし*で56.8%、ツールあり*で64.7%を記録しました。前世代モデルのOpus 4.6（ツールなし40.0%、ツールあり53.1%）を大幅に上回っており、最高難度の学術的問題でも突出した推論能力をもっています。

*ツールなし：AIが学習データとして持っている内部の知識と、自身の推論能力だけで回答する場合

*ツールあり：AIが自身のデータに加えWeb検索や専門データベースなどを使いながら回答する場合

OSWorld-Verified

OSWorld-Verifiedは、AIが実際のコンピューター画面を見ながら、クリックやタイピングなど人間と同じ操作でソフトウェアを使いこなせるかを評価するベンチマークです。

ファイル操作やアプリの設定、複数アプリにまたがる作業など、実際に人間がおこなう操作に近いタスクへの対応力を測ります。

参照：ANTHROPIC「Project Glasswing」

Claude MythosのOSWorld-Verifiedスコアは79.6%で、前世代モデルのOpus 4.6が記録した72.7%を上回り、またGPT-5.4の75.0%も超えました。AIが実際にパソコンを操作して業務をこなす能力においても、Claude Mythosが最高水準にあります。

SWE-bench Verified

SWE-bench Verifiedは、GitHubに実際に投稿されたバグ報告をもとに、AIがコードを修正できるかを評価するベンチマークです。実際の開発業務に近い形式で評価できるとして、業界で広く使われています。

参照：ANTHROPIC「Project Glasswing」

Claude MythosのSWE-bench Verifiedスコア93.9%はOpus 4.6（80.8%）を約13ポイント上回っており、実務レベルのソフトウェアエンジニアリング能力を備えていることがわかります。

Claude Mythosが発見した脆弱性の実例

ここでは、Claude Mythosが性能テストで実際に発見した脆弱性の例を3つ紹介します。

Claude Mythosが発見した脆弱性の実例

OpenBSD
FFmpeg
FreeBSD

それぞれ、詳しく解説します。

OpenBSD

OpenBSDとは、世界の重要インフラの運用に広く使われており、屈指のセキュリティ強度を誇るオープンソースのOSです。Claude Mythosはそのような堅牢なシステムで27年間誰にも発見されなかった脆弱性を自律的に発見しました。

この脆弱性を悪用されると、攻撃者はOpenBSDが稼働しているマシンにアクセスするだけで、そのマシンを遠隔操作でシステム不全にすることができます。Anthropicは発見後にOpenBSDの管理者に報告し、現在は修正済みです。

FFmpeg

FFmpegは動画や音声の変換・処理に使われるソフトウェアで、世界中の多くのアプリやサービスの基盤として組み込まれています。Claude MythosはそのFFmpegのシステムで16年間見逃されてきた脆弱性も発見しています。

注目すべきは、その脆弱性が潜んでいたコードは自動のテストツールによってすでに500万回もテストされていたにもかかわらず、一度も検出されなかった点です。

長年にわたって見逃されていた欠陥をClaude Mythosがわずかな時間で指摘したのは、既存のセキュリティ対策の限界を示しているといえるでしょう。

FreeBSD

主要なサーバーやネットワーク機器に広く使われているオープンソースOSのFreeBSDで、17年間気付かれなかったリモートコード実行の脆弱性が潜んでいました。

この脆弱性の恐ろしい点は、悪用した場合の被害の大きさです。インターネット上のどこにいる攻撃者でも、対象サーバーへの認証なしで完全な管理者権限を取得できてしまうため、システムを自由に操作される危険性があります。

さらには、Claude MythosがこのFreeBSDの脆弱性を発見から悪用まで人間の介入ゼロで自律的におこなったとAnthropicの公式ブログに明記されています。

Claudeのほかのモデルとの比較

これまでAnthropicから発表されたモデルのベンチマークを以下の表にまとめました。

	Claude Mythos	Opus 4.6	Sonnet 4.6
CyberGym	83.1%	66.6%	–
GPQA Diamond	94.6%	91.3%	89.9%
Humanity’s Last Exam（with tools）	64.7%	53.1%	–
OSWorld-Verified	79.6%	72.7%	72.5%
SWE-bench Verified	93.9%	80.8%	79.6%
Terminal-Bench 2.0	82.0%	65.4%	59.1%

上記3つのモデルを比べると、Sonnet 4.6から着実に各種ベンチマークのスコアが伸びています。また、Claude MythosとOpus 4.6を比べると、Claude Mythosのスコアが飛び抜けて高いのも明らかです。

Claude Mythosがほかモデルとは異なる次元の性能をもつモデルということが表からもわかるでしょう。

Project Glasswingの始動

AnthropicはClaude Mythosを一般に公開しないと発表したと同時に、「Project Glasswing（プロジェクトグラスウィング）」という新規プロジェクトを始動させています。

このプロジェクトに関する以下の情報にまとめました。

Project Glasswingの始動

セキュリティ防衛に取り組むプロジェクト
パートナー企業にのみ提供
取組結果の公表を予定

セキュリティ防衛に取り組むプロジェクト

Project Glasswingとは、Claude Mythosの高いサイバーセキュリティ能力をセキュリティ防衛に活用するため、Anthropicが立ち上げたプロジェクトです。すでに一般に広く利用されているソフトウェアの脆弱性を発見・修正することを目的としています。

Anthropicが定めたアメリカの企業12社が参画しており、各社がClaude Mythosを使って自社サービスの脆弱性やセキュリティの改善に取り組んでいます。

パートナー企業にのみ提供

Claude Mythosが提供されているテック系企業12社は以下のとおりです。

Amazon Web Services
Anthropic
Apple
Broadcom
Cisco
CrowdStrike
Google
JPMorganChase
Linux Foundation
Microsoft
NVIDIA
Palo Alto Networks

Anthropicはこのプロジェクトに対して最大1億ドル分のクレジットを提供するほか、オープンソースのセキュリティ団体へ400万ドルの寄付もしています。

取組結果の公表を予定

Project Glasswingは現在も進行しています（2026年4月末時点）。Anthropicによれば、Project Glasswingが発表された4月7日から90日以内に取り組みの成果が公表される予定です。

参照：ANTHROPIC「Project Glasswing」

公表内容には、新たに発見・修正された脆弱性や、Project Glasswingを通して得られた知見、今後の公開に関する情報などが発表される可能性があります。

一般公開されていない最上位のモデルについてAnthropicからどのような情報が明かされるのか、続報が待たれます。

Claude Mythosに対する社会の反応

Claude Mythosはまだ一般には利用できないモデルのため、不明点が多くあります。Claude Mythosに対してAI界隈はどのような反応をしているのでしょうか。

Claude Mythosに関する著名人・団体の意見をまとめました。

Claude Mythosに対する社会の反応

Anthropic公式「超人的なシステムに憂慮」
Yann LeCun（Meta 元チーフAIサイエンティスト）「誇張されすぎ」
JD Vance（米国副大統領）「Mythos公開前にCEOを招集」

Anthropic公式「超人的なシステムに憂慮」

Claude Mythosの公開にあたり、Anthropicは244ページにおよぶ報告書（System Card: Claude Mythos Preview）を公開しました。

そのなかでAnthropicは、「業界全体で十分な安全策が整わないまま、超人的なシステムの開発へ急速に突き進もうとしている状況に強い懸念を感じている」と危機感を示しています。

これは、AIの安全性を重視するAnthropicが、Claude MythosをはじめとするAIモデルが凄まじいペースで開発されていることに対して警鐘を鳴らしたものです。AIの安全対応が現在の開発ペースに追いついていないという問題提起でもあるでしょう。

Yann LeCun（Meta 元チーフAIサイエンティスト）「誇張されすぎ」

Meta社の元チーフAIサイエンティストであるYann LeCun（ヤン・ルカン）氏は、Claude Mythosに対し「Mythos drama = BS from self-delusion（Claude Mythosをめぐる騒動は妄想によるたわごとだ）」とXに投稿し、Anthropicの発表が誇張されすぎていると主張しています。

LeCun氏はかねてよりLLMの限界を主張しており、今回の発言もその延長にあるといえるでしょう。Claude Mythosの評価をめぐっては業界内でも意見が分かれており、最新AIの情報に触れる際はさまざまな立場の意見を参考にしながら冷静に判断する姿勢が大切です。