Anthropic、米国エネルギー省の「1,000人科学者AI Jam」に参加

Anthropic社が米国エネルギー省主催の初開催となる「1,000人科学者AI Jam」に参加することを発表しました。これは複数の国立研究所の科学者が集まり、AI技術を科学研究や国家安全保障に役立てられるかを評価するイベントです。Anthropic社は新開発の「Claude 3.7 Sonnet」というAIモデルを持ち込み、文献調査や実験計画、データ分析など様々な科学的課題での性能を実際の研究問…

AnthropicのAI「Claude」がAmazonの音声アシスタント「Alexa+」を支える

Anthropic社は、自社が開発したAI「Claude」がAmazonの新しい音声アシスタント「Alexa+」の動作を支えることを発表しました。AnthropicとAmazonは1年かけて協力し、Claudeの高度な能力をAlexa+に組み込みました。Claudeは詐欺的な使用を防ぐ安全機能に優れており、Alexa+もこの安全性を備えています。Alexa+はAmazonのクラウドサービス(Ama…

パリAIサミットにおけるダリオ・アモデイのステートメント:より迅速で重点的な対応の必要性

Anthropic創業者のダリオ・アモデイは、パリで開催されたAI行動サミットに参加し、AI技術の急速な進展に対応するため、3つの重要な課題に更なる注力が必要だと主張しました。第一に民主主義国家がAI開発で主導権を保つこと、第二に高度なAIがもたらすセキュリティリスク(核兵器開発への悪用など)への対策強化、第三に2026~2030年までにAI技術が人間の仕事を大規模に自動化する可能性があることへの…

Lyft、ClaudeをAIアシスタントとして4000万人以上のライダーと100万人以上のドライバーに導入

ライドシェアサービスのLyftが、Anthropic社のAI技術「Claude」を活用した新しいサービスを導入します。すでにLyftのカスタマーサービスで運用されているClaudeは、顧客サービスの対応時間を87%削減し、毎日数千件の問い合わせに対応しています。今後、Lyftはこのパートナーシップを通じて、ライダーとドライバーの双方向体験を改善する3つの領域で協力します。①AIを活用した新サービス…

Anthropic の責任ある AI 開発ポリシー - 安全性を重視した段階的な基準を発表

Anthropic は、AI 技術の発展に伴う危険性を管理するための「責任ある拡張ポリシー(RSP)」を発表しました。このポリシーは、生物兵器開発の悪用やAIの暴走によるテロ行為など、カタストロフ的なリスクに対応するものです。生物学的危険物を扱う際の安全基準をモデルにした「AI安全レベル(ASL)」という5段階の枠組みを導入。現在のClaudeはASL-2(早期段階で危険な能力を示す)に分類され、…

Anthropicが責任あるAI開発の国際基準「ISO 42001」認証を取得

Anthropic(AI研究企業)が、AI管理システムの国際基準「ISO/IEC 42001:2023」の認証を取得しました。この基準は、AI技術が安全かつ倫理的に開発・運用されるための要件を定めた世界初の国際規格です。Anthropicは、AIシステムの設計・開発・導入に関するルールを整備し、問題を事前に防ぐための厳密なテストと監視、ユーザーへの情報開示、そして責任ある管理体制を構築していること…

2024年の世界選挙に向けた準備:AIツールの不正使用防止対策

2024年は世界人口の半数以上が投票する選挙の年です。AI企業のAnthropicは、自社のAIツール「Claude」が選挙期間中に悪用されるのを防ぐため、複数の対策を実施しています。具体的には、政治キャンペーンでのAI使用を禁止するルール作成、AIが虚偽情報を広げないかテストする検査、そして投票方法を尋ねられた時は正確な情報源へユーザーを誘導することです。また、AIが自信を持って間違った情報を述…

AI規制の国際的な動き:米国の大統領令、G7行動規範、ブレッチリー・パーク・サミット

2023年11月、AI政策に関する3つの重要な国際的イベントが開催されました。米国政府は100ページ以上の包括的な大統領令を発行し、AI開発企業の安全性評価やリスク管理の強化を指示しました。G7は国際的な行動規範を策定し、AIの開発と展開におけるベストプラクティスを示しました。英国はブレッチリー・パークでAI安全性サミットを開催し、28ヶ国がAI技術の利益を活用しながらリスクに対処することに合意し…

AIの安全性を守るための「レッドティーミング」戦略

Anthropic社は、AI技術が国家安全保障に関わるリスク(生物兵器設計など)をもたらす可能性があると指摘し、これを測定・軽減するための「フロンティア脅威レッドティーミング」という取り組みを発表しました。生物学分野での試験プロジェクトで、専門家と150時間以上かけてAIモデルが危険な情報をどの程度出力できるかを調査。結果として、現在のAIモデルは危険な情報を生成する可能性があり、今後2~3年以内…

最先端のAIモデルのセキュリティ確保に向けた取り組み

Anthropicは、急速に進化するAIモデルの盗難や悪用を防ぐため、高度なセキュリティ対策の実装を発表しました。同社は、銀行の金庫のように「2つの鍵が必要」というルール(二者承認制)をAI開発に適用し、単独で重要なシステムにアクセスできないようにすることを推奨しています。また、ソフトウェア開発の業界標準(NIST基準)をAI開発にも適用し、開発から導入まで「どのモデルがどこから来たか」を追跡可能…