Anthropic社は、AI助手「Claude」を安全に使ってもらうため、複数の層から成る保護システムを構築しています。具体的には、使用ポリシーの策定、モデルの訓練段階での改善、リリース前の厳格なテスト、そしてリリース後のリアルタイム監視という4つのアプローチを実施しています。例えば、2024年の米国選挙では外部専門家と協力して古い情報を提供しないよう改善し、ユーザーに信頼できる情報源を案内するバナーを表示させました。また、スパム生成やマルウェア作成の試みを自動検出するシステムや、アカウントレベルでの違反パターン追跡も行っています。これらの取り組みは、子どもの安全、選挙の信頼性、サイバーセキュリティなど、社会的に重要な領域を保護することに重点を置いています。