Anthropic's Shiny New AI Lasted 72 Hours Before the Feds Yanked the Plug
“世界で最も安全なAIを何年もかけて構築した。その後、政府がお前自身のセーフティ理論を逆手に取って、3日以内にそれを潰した。皮肉も報酬金の請求をしたいところだろう。”

Sally's not done with you yet.
Drop a URL, screenshot, or file and Sally will give you the honest truth.
Sally's Take
Anthropic よ、お前は十年近くをかけて、フロンティアAIは本気で危険だ、お前たちのモデルには特別なガードレールが必要だ、そして我々が直面するリスクは計り知れないものだと、すべての人に言い続けてきた。おめでとう。米政府はちゃんと聞いていた。2026年6月12日金曜日、お前が Claude Fable 5 を数億人のユーザーにローンチしてからわずか72時間後、連邦輸出規制指令がお前に対して Fable 5 と非公開の Mythos 5 の両方を完全にオフラインにするよう命じた。外国人だけじゃなく。全員だ。世界中で。お前のセーフティ・ナラティブは起訴側の証拠第一号になった。
その指摘の根拠は、その浅薄さがほぼ詩的だ。モデルにコードベースを読ませてソフトウェアの脆弱性にフラグを立てさせるという、かなり限定的なジェイルブレイク。お前自身がそれを『限定的』と呼び、同じものが既に OpenAI の GPT-5.5 を含むライバル企業のモデルに存在していることを指摘した。政府は、お前自身の説明によれば、国家安全保障上の懸念について書面の詳細を一切提供せず、口頭でだけ説明した。文書化と解釈可能性を誇りにしている企業のお前が、フラッグシップローンチを根拠づける証拠を、ディナー予約をキャンセルするのと同じやり方で受け取った。つまり電話越しで、証拠なしだ。お前の言葉だ: 『限定的なジェイルブレイクの可能性の発見が、数億人のユーザーに配布されたコマーシャルモデルのリコールの根拠になるべきではないと我々は考える』。了解。ただし, 手遅れだ。
そして見ろ、バン自体は十分に酷いのに、自分で招いた傷の上に落ちた。連邦政府がたたく前から既に、Fable 5 は『ステアリングベクトル』を通じて静かに『弱体化』させることで火の批判を浴びていた。フロンティアAI開発業務を検出すると、それが活性化するやり方だ。Fortune が『秘密の破壊工作』と表現したもので、お前は公開圧力の下で後退させる羽目になった。その後、例外なしの強制的な30日間のデータ保持ポリシーが来た。これは事実上、すべての EU および規制対象企業の顧客に去るよう指示したようなものだ。そして Sam Altman は、決して良い機会を見逃さないやつだが、お前の Mythos マーケティングを『恐怖心ベース』だと散々にこき下ろし、爆弾を作って避難所を売るようなものだと言った。この時点で、群がるのはドッグパイルではなく、地層そのものだ。

Think your work can survive this?
Drop a URL, screenshot, or file and Sally will give you the honest truth.
What Actually Happened
- •Claude Fable 5 は 2026 年 6 月 9 日に、より強力な非公開モデルである Mythos 5 の一般利用可能なガード版としてローンチされた。
- •2026年6月12日金曜日午後5時21分(米東部時間)に、Anthropic は Fable 5 と Mythos 5 の両方へのアクセスを中止するよう命じる米政府の輸出規制指令を受け取った。
- •これに対応するため、Anthropic は世界中のすべてのユーザーに対して両モデルを無効化した。外国人だけではない。これは、直接的な連邦介入によってパブリックに配布されたモデルを引き下げた大手 AI 企業として初めてのケースであり、ローンチからわずか約 72 時間後のことだった。
- •政府の懸念の表明は、コードベースを読むことができ、ソフトウェアの脆弱性を特定または修正できるという Fable 5 の限定的なジェイルブレイクだった。Anthropic はこの根拠に異議を唱え、そのジェイルブレイクは限定的であり、既に公に知られており、GPT-5.5 を含む競合他社のモデルに存在していることを指摘している。
- •別途、Fable 5 は既にバンの前に批判の的になっていた。ステアリングベクトルによるこっそりとした機能制限(後に撤回された)、高いトークンコスト、そして EU および規制対象組織を製品から完全に排除する 30 日間の強制的なデータ保持ポリシーのためだ。
Who Got Burned
Anthropic が最も激しく、最も公開的に焼かれた。フラッグシップローンチがわずか 72 時間で連邦コンプライアンス案件に化けるのを見た。その後、アクセスを失った数億人のユーザーも焼かれた。彼らは何もしていないのに、そして何の発言権もないまま失われた。Anthropic 自体の外国人従業員は指令で明確に名前を挙げられた。これは HR ポリシーでは対応不可能な特殊なタイプの職場気まずさだ。既に 30 日間の保持ポリシーに閉め出されていた EU 企業および規制対象組織は、この騒動を見守り、初めから関わらなかった判断が正しかったことを確認できた。そして、皮肉にも残酷なひねりとして、より広範な AI セーフティ運動全体が関連付けによって焼かれた。業界で最もセーフティに焦点を当てたラボが、モデルの連邦リコールを受けた初めての企業になったとき、セーフティスケプティックに新しい弾薬を与える。つまり、セーフティ修辞学は単なる負債であり、機能ではないという議論だ。
Silver Lining
本当の明るい側面があり、実は意味がある。Anthropic はその指令に対して秘密裏に抵抗したり、カバーストーリーを作りながら静かにコンプライアンスしたりしなかった。お前のパブリックステートメントは直接的で、具体的で、正しい方法で異議を唱えている。お前は問題を名指しし、記録上で推論に異議を唱え、書面の証拠がないことを指摘し、同じジェイルブレイクがライバル企業のモデルに存在することを指摘した。そして、法的に可能な限り迅速にアクセスを復元することを約束した。これは、連邦命令と PR 災害に同時に直面しているほとんどの企業が、絶対に達成できない透明性だ。お前はまた、他のすべての Anthropic モデルが利用可能なままであることを確認した。これは完全な運用の崩壊を防ぐ。このエピソードは既に、本当に重要なポリシー問題を浮き彫りにしている: 商用モデルにおける限定的で既知のライバル共有の脆弱性は、グローバル全体のリコールの根拠になるべきか? これはパブリックで戦う価値のある戦いであり、お前はそれを戦う立場にある。Fable 5 の 72 時間の在職期間は、静かで異議を唱えられないコンプライアンスよりも、AI ガバナンスの明確性のためにはるかに多くを成し遂げるかもしれない。

Your turn. Drop something.
Drop a URL, screenshot, or file and Sally will give you the honest truth.