Anthropic社がAIシステムから生じる可能性のある幅広い危害に対処するための新しい枠組みを発表しました。生物学的脅威などの極端なシナリオから、児童安全やデマ、詐欺といった重要な懸念まで、複数の次元(身体的、心理的、経済的、社会的、個人の自由に関する影響)から潜在的な危害を評価します。同社は使用ポリシーの策定、事前・事後の評価、悪用検知技術、厳格な対応を組み合わせてリスクを管理しています。例えば、コンピュータ操作機能の開発では、銀行詐欺やフィッシング詐欺の可能性を考慮し、安全性を保ちながら有用性を維持するバランスを取っています。このアプローチは継続的に進化し、業界全体との協力を求めています。