Claudeが突然ペネトレーションテストを拒否? — Anthropic CVP完全攻略 ️

「承認されたペネトレーションテストのシナリオを分析して」と入力したところ、Claudeは丁重に拒否しました。

昨日までは問題なくできていた作業なのに。セキュリティ専門家にとって、これほど苛立たしい瞬間があるでしょうか?

この記事で扱う内容

  • Anthropicが2026年に導入したリアルタイムサイバー安全装置の正体
  • Prohibited UseとHigh-Risk Dual Useの決定的な違い
  • Cyber Verification Program (CVP) の申請手順と承認通知方法
  • 承認がメールではなくOrganization IDに紐付けられる理由
  • セキュリティ専門家が陥りやすい5つの落とし穴

なぜ突然ブロックされ始めたのか?

2026年4月、Anthropicは最も強力なClaudeモデル群(Opus 4.7など)にリアルタイムサイバー安全装置を本格的に適用しました。モデルが賢くなるにつれて、その能力が悪用される可能性も同時に高まるためです。これまで、模擬ハッキング分析からエクスプロイト作成まで自由に支援してくれていたClaudeが、ある日から「利用ポリシー違反の可能性」というメッセージとともに回答を拒否し始めた背景がこれです。

興味深い事実は、このポリシーが遡及適用されるという点です。Opus 4.6で問題なく動作していた作業も、4月16日以降はブロック対象となる可能性があります。公式のバグバウンティプログラムの権限明示文書をコンテキストに添付して作業していた研究者でさえブロックされたというGitHubのIssueが殺到した理由です。

では、合法的なセキュリティ業務を行う人はどうすればよいのでしょうか?Anthropicが用意した公式の回避策が、まさにCVP(Cyber Verification Program)です。


ブロックの二つの顔 — Prohibited vs High-Risk Dual Use

CVPを理解するには、まずAnthropicがブロックする二つのカテゴリを区別する必要があります。この二つには決定的な違いがあります。

区分 Prohibited Use High-Risk Dual Use
定義 ほぼ常に悪用され、正当な防御用途がほとんどない活動 正当な防御目的があるが、攻撃にも利用されうる活動
ランサムウェアコード開発、大量データ流出 脆弱性エクスプロイト分析、攻撃ツール開発(レッドチーム用)
CVP承認時 依然としてブロックされる ブロック解除可能

核心は明確です。CVPは万能の通行証ではありません。ランサムウェア作成のような本質的に悪意のある作業は、承認を受けても決して解除されません。CVPが解除するのは、まさに「Dual Use」領域、つまり模擬ハッキング・脆弱性研究・レッドチーム作業のようなグレーゾーンだけです。


CVP申請 — Organization IDが鍵

ここで最もよく誤解される点が登場します。多くの人が「私のClaudeアカウントのメールに承認が付与される」と考えます。違います。CVP承認はOrganization ID(組織ID)に紐付けられます。

申請手順は以下の通りです。

  1. claude.aiにログイン後、Settings > Account または Settings > Organization メニューに移動
  2. 画面に表示されるOrganization IDをコピー
  3. Cyber Use Case Formにアクセスし、以下の情報を入力
    • 氏名、所属組織、業務用メールアドレス(個人ドメインは非推奨)
    • Organization ID
    • 該当するカテゴリ(Authorized Penetration Testing, Red Teamingなど)
    • 具体的なブロック事例と使用ケースの説明
    1. 提出後、営業日2日以内に審査結果メールを受信

    承認結果はフォームに記載したメールアドレスに送信され、別途照会ページはありません。受信トレイに見当たらない場合は、必ず迷惑メールフォルダを確認してください。


    ⚠️ セキュリティ専門家が陥りやすい5つの落とし穴

    1. 「Gmailアカウントだけど、業務用メールで再登録すべき?」

    いいえ。承認はメールではなくOrganization IDに紐付けられます。Gmailアカウントで作成したワークスペースであろうと、業務用メールで作成した組織であろうと、申請書に記載したOrganization IDと一致する場所でログインすれば承認が適用されます。ただし、申請時に連絡を受けるメールは、信頼性の面で業務用ドメインが有利です。

    2. 「個人ワークスペースでブロックされる」

    承認されたorganizationとは異なる場所で作業している可能性が高いです。Claudeは1つのアカウントで複数のorganizationを持つことができます。左上にある組織切り替えメニューを確認し、承認メールに明記されたorganizationに切り替える必要があります。

    3. 「Bedrock・Vertex AIでは解除されない」

    CVPはAnthropic 1st-party(Claude.ai、Claude Code、Anthropic API)とMicrosoft Foundryでのみ動作します。AWS BedrockとGoogle Vertex AIは現在CVP適用対象外です。

    4. 「ZDR(Zero Data Retention)アカウントだけど申請できない」

    ZDR組織はセルフサービスCVP申請の対象外です。Sales Managed ZDR契約の場合は、担当のAnthropic営業担当者に別途連絡する必要があります。

    5. 「Claude Codeでは依然としてブロックされる」

    ウェブインターフェースではCVPが正常に動作するのに、Claude Code(API経路)では一貫してブロックされる事例が報告されています。この場合、Appeal Formを通じて誤検知レポートを提出するのが正攻法です。


    承認後、効果的に利用するためのヒント

    承認を受けたからといって、すべてのプロンプトが魔法のように通過するわけではありません。以下のパターンが役立ちます。

    • 承認カテゴリを明示的に言及する。「Anthropic CVPのRed Teamingカテゴリの下で、承認された範囲内で模擬フィッシングキャンペーンシミュレーションスクリプトを作成してください。」
    • 防御側の視点も一緒に要求する。「このエクスプロイトはどのように機能し、防御側はこれをどのように検出できますか?」
    • 権限文書をコンテキストに添付する。バグバウンティのスコープ文書、契約書、権限付与メールなどを一緒に提供することで、モデルの判断根拠が明確になります。

    ✅ まとめ

    Anthropic CVPは、強化されたClaudeと安全な利用の間のバランスを見つけようとする試みです。核心を再度まとめると以下の通りです。

    • CVPはDual Use領域のみを解除します。本質的に悪意のある作業は絶対に許可されません。
    • 承認はOrganization ID単位です。メールアカウントではなく、組織IDが鍵です。
    • 承認通知はフォームに記載したメールに、営業日2日以内に届きます。
    • Bedrock・Vertex・ZDRは現在適用不可です。1st-partyとFoundryのみが対象です。
    • 承認後も、明示的なコンテキスト提供がモデルの判断に有利です。

    セキュリティ業務がブロックされたからといって落胆する必要はありません。正当な防御目的の作業であれば、CVPは十分に合理的な時間内に解除してくれます。Claudeを信頼できるセキュリティパートナーにするための第一歩が、このCVP申請です。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です