子どもの安全保護に関する原則への取り組み

原題: Aligning on child safety principles

📝 要約

Anthropicを含む主要なAI企業は、生成AI技術（コンピュータが自動で文章や画像を作る技術）の開発・運用・管理において、子どもの安全を守るための包括的な対策を実施することを公表しました。この取り組みは、子どもへの性的虐待から守ることを目的とした非営利団体Thornが主導しています。Anthropicは、児童虐待画像の生成・拡散防止に向けて、データの厳選から検出・報告までの具体的な施策を講じています。同社のAIモデルは児童虐待に関連するコンテンツを厳禁としており、違反が検出された場合は当局に報告されます。これは「デザインによる安全」という考え方に基づいており、開発段階から運用まで、あらゆる過程で子どもの保護を優先させるものです。

📌 ポイント

Anthropicを含む複数のAI企業が、児童虐待コンテンツの生成・拡散防止で連携する新しい取り組みを開始
訓練データの段階から、児童虐待に関連するコンテンツを検出・削除・報告する体制を構築
AIモデルの悪用防止のため、広範な検査（レッドチーミング）とユーザー報告機能を実装
児童虐待コンテンツが検出された場合は、National Center for Missing & Exploited Children（全米失踪・搾取児童センター）に報告
開発から運用・保守まで、全段階で子ども保護を組み込む「デザインによる安全」の原則を採用

💡 わかりやすく言うと…

これは、銀行が不正な資金移動を防ぐために、送金の受け付け段階で確認し、処理中も監視し、後からも記録を確認するのと似ています。AIの場合も、作成段階・使用段階・保守段階という全てのステップで、有害なコンテンツが現れないよう多重の防御層を用意しています。