AI システムの「レッドチーミング」における課題と実践方法
Anthropic社は、AI システムの安全性を確保するための「レッドチーミング」(敵対的テスト)について、実践的な知見をまとめました。レッドチーミングとは、セキュリティの専門家が侵入者になったつもりで、システムの弱点を探す検査方法です。同社は、言語専門家や安全保障の専門家など各分野の専門家と協力したテスト、多言語での検査、AI自体を使った自動テストなど、複数のアプローチを試してきました。ただし、…
Anthropic社のブログ記事を非エンジニアにもわかりやすい日本語で紹介
Anthropic社は、AI システムの安全性を確保するための「レッドチーミング」(敵対的テスト)について、実践的な知見をまとめました。レッドチーミングとは、セキュリティの専門家が侵入者になったつもりで、システムの弱点を探す検査方法です。同社は、言語専門家や安全保障の専門家など各分野の専門家と協力したテスト、多言語での検査、AI自体を使った自動テストなど、複数のアプローチを試してきました。ただし、…
2024年は、ChatGPTなどの生成AI(文章や画像を自動生成する技術)が広く使われるようになって初めての大規模な選挙年となりました。Anthropic社は、AIが選挙に悪影響を与える可能性を懸念し、安全対策を実施しました。具体的には、キャンペーン活動や虚偽情報の生成を禁止するルールを設けたほか、AIの悪用に対して複数回のテストを実施しました。実際の使用状況を分析すると、Claude(Anthr…
Anthropic社が「モデルコンテキストプロトコル(MCP)」という新しい技術標準をオープンソース化しました。これは、AIアシスタント(会話型AI)が企業のデータベースやビジネスツール、開発環境などのデータにアクセスしやすくするための共通ルールです。これまでAIがデータにアクセスするには、それぞれのシステムごとに異なる接続方法を作る必要があり、手間がかかっていました。MCPを使えば、すべてのデー…
Anthropicはアマゾン・ウェブ・サービス(AWS)との協力を拡大することを発表しました。アマゾンから40億ドルの新規投資を受け、これによってアマゾンの総投資額は80億ドルに達します。AWSはAnthropicの主要なクラウドおよび学習パートナーになります。 この拡大協力には、AWSの特別なAI処理用チップ「Trainium」の共同開発が含まれます。AnthropicのエンジニアとAWSのチ…
AI安全研究企業のAnthropicは、アマゾンから最大40億ドルの投資を受けることを発表しました。この提携により、AnthropicのAI技術とアマゾンウェブサービス(AWS)のクラウドインフラ技術を組み合わせ、より安全で信頼できるAI「Claude」を世界中の企業が使えるようにします。アマゾンはAnthropicのメインクラウドプロバイダーとなり、特別な計算チップを提供します。すでに法律事務所…
Anthropic社は、AI会話モデル「Claude 3 Haiku」をAmazon Bedrock上でカスタマイズできる機能を提供開始しました。企業が自社のデータを使って学習させることで、より正確で業務に特化した性能を実現できます。例えば、カスタマーサポートの対応をモデルに学習させると、回答の正確さが99.6%に向上し、処理速度も85%高速化するなど、大幅なパフォーマンス改善が期待できます。SK…
Anthropic社は、急速に進化する強力なAIシステムが科学進歩や医療の発展をもたらす一方で、サイバー攻撃や生物・化学兵器の悪用といった深刻なリスクも増加していると警告しています。同社は、今後18ヶ月間が政府による予防的な規制政策の決定の重要な時期であると指摘。企業の自主的な安全性確保方針(Responsible Scaling Policy)を基にした、シンプルで的確な規制フレームワークが必要…
セールスフォース(営業支援システムの大手企業)がAnthropicの最新AI「Claude」を統合しました。これにより、セールスフォースの利用企業は営業、顧客サービス、マーケティングなど様々な業務でClaudeの力を活用できるようになります。Claudeは間違った情報を出しにくく、人間に近い表現ができるのが特徴です。企業はAmazon Bedrockというクラウドサービス経由でClaudeにアクセ…
AI企業のAnthropicは、高度なAIシステムのリスクに対処するための「責任あるスケーリング政策」を大幅に更新しました。この政策は、AIの能力が高まるにつれて、それに応じた安全対策を実施するという考え方に基づいています。新しい政策では、AIの能力が一定の基準に達したら、より厳しい安全措置を取ることを定めています。特に、AIが独立して複雑な研究を行えるようになったり、危険な兵器製造に使用される可…
Anthropic社は、2024年の米国選挙に向けて、AI(人工知能)ツールの悪用防止に取り組んでいます。同社のAIアシスタント「Claude」が選挙に関する有害な用途に使われないよう、複数の対策を実施。具体的には、政治キャンペーンへの利用禁止、選挙情報に関するデマ(虚偽情報)の生成禁止、ディープフェイク(合成映像)の生成防止などです。また、自動監視システムと人間による審査を組み合わせて不正利用を…