Anthropic社は、自社のAI「Claude」が悪意のある利用者に悪用されるケースを検知し、対抗する取り組みについて報告しました。報告書では4つの具体的な悪用事例を紹介しており、これらには選挙工作用の偽アカウント操作、カメラの認証情報盗難、求人詐欺、初心者による不正ソフト開発などが含まれています。特に注目すべき事例は、Claudeを複数の偽アカウントを自動的に操作する「指令塔」として使用し、数万の本物のSNSアカウントに接触した影響工作です。Anthropicは検知や対抗技術を継続的に改善し、悪用者のアカウント停止やシステム検知の強化を行っています。