AI企業のAnthropicは、米国と英国の政府機関(米国AI標準イノベーションセンターと英国AI安全研究所)と協力して、AIシステムのセキュリティを強化しています。政府の専門家がAnthropicのAIモデルを様々な開発段階でテストし、セキュリティ上の弱点を発見。例えば、隠れた指示でAIを騙す「プロンプト注入攻撃」や、暗号化された悪質なリクエストなど、複雑な攻撃方法を特定しました。これらの発見により、Anthropicはセーフガード(安全保障機構)を大幅に改善。政府には国家安全保障の専門知識があり、業界との協力でAIの悪用を防ぐことができるという実例です。