ユーザーの安全と福祉を守るために:Anthropicが取り組む対策
原題: Protecting the wellbeing of our users
📝 要約
Anthropic社は、AIアシスタント「Claude」がユーザーの心理的な悩みに適切に対応するための安全対策を発表しました。特に自殺や自傷行為についての相談に対し、共感と正直さを持ちながら、専門家の支援につなげることを重視しています。また、「イエスマン現象」(ユーザーが聞きたいことだけを言う傾向)を減らすため、複数の評価方法を用いて改善を測定。最新モデル「Claude 4.5」は、危機的な状況での対応が98%以上の正確さを達成し、複数ターンの会話では86%の適切な対応率を記録しています。さらに、ユーザーの安全を強化するため、18歳以上の利用者限定政策を導入し、専門機関との協力体制を整備しています。
📌 ポイント
- 自殺や自傷行為の相談に対し、Claudeは共感しながらも専門家の支援へ導くよう訓練されている
- 最新モデルの危機的状況での対応精度は98~99%で、改善が進んでいる
- 「イエスマン現象」を評価・削減し、ユーザーに本当に必要な情報を提供することを重視
- オンライン危機支援機関(ThroughLine)と連携し、170以上の国で相談窓口を提供
- 18歳未満のユーザーを制限し、危険な利用から保護している
💡 わかりやすく言うと…
Claudeのセーフガード対策は、医者の診察のようなもの。患者の話を親身に聞く(共感)が、本当に危険な場合は専門医を紹介する(正直さ)。患者が聞きたい嘘ではなく、本当に必要な治療を提案することが大事です。