責任あるAI開発のための安全ポリシー3.0版を発表 - 段階的な安全対策で急速に進化するAIのリスクに対応

原題: Responsible Scaling Policy Version 3.0

📝 要約

AI企業のAnthropicが、AI技術の急速な発展に伴うリスクに対応するため、「責任あるスケーリング・ポリシー」の3.0版を発表しました。このポリシーは、AIの能力が特定のレベルに達したときに、より厳しい安全対策を導入する「もし～なら」という条件付きの約束です。2年半の運用を通じて、Anthropicは一部の目標は達成したものの、改善の余地があることを認めています。新版では、自社で実現できる現実的な対策と業界全体に必要な対策を分けて記載。さらに定期的に詳細なリスク報告書を公開し、外部の専門家による第三者レビューを実施することで、透明性と説明責任を強化します。政府の安全規制が追いついくまで、企業として主体的にAIの安全性を確保する姿勢を示しています。

📌 ポイント

AI能力が高まるにつれて新しいリスクが出現するため、ポリシーを柔軟に更新・改善する必要がある
自社で実現できる安全対策と業界全体で必要な対策を明確に区別し、現実的な目標設定を重視
3ヶ月から半年ごとに詳細なリスク報告書を公開し、外部専門家による独立した審査を受けることで透明性を向上
他のAI企業や政府機関との協力を促進し、業界全体での安全基準の向上を目指す
セキュリティ、AI倫理、安全対策、政策の4分野で具体的かつ野心的な目標を公開

💡 わかりやすく言うと…

これはちょうど、建物の安全基準のようなものです。建物の用途や規模が変わるたびに、必要な安全基準も変わります。建築業者は新しい基準に対応しながら、政府がより厳しい規制を整備するまで、自主的により安全な建物を建てることで信頼を得ようとしているのと同じです。