Keplerが金融サービス向けに検証可能なAIを構築した方法
原題: How Kepler built verifiable AI for financial services with Claude
📝 要約
金融企業向けAIプラットフォーム「Kepler Finance」は、2600万件以上のSEC提出資料や企業データを扱い、すべての数字を元の書類まで遡って検証できます。創業者たちは、従来のAIが計算結果を生成する際に間違いやすい問題を解決するため、AIの「推論層」と「検証層」を分離する設計を採用。Claudeに複雑な質問の分析と計画を任せ、実際の計算は決定的で検証可能なシステムで実行することで、金融規制環境で信頼できるAIを実現しました。わずか3ヶ月で14000社以上、27の市場のデータをインデックス化し、金融機関の「AIの結果をどう監査するのか」という根本的な課題に答えを出しています。
📌 ポイント
- 従来のAIは推論と計算を同時に行うため誤りが生じやすい。Keplerは「AIが考える」と「システムが計算する」を分離し、すべての数字を元の書類まで遡って検証可能にした
- 複雑な多段階の金融分析でClaude(推論モデル)が他のAIと異なる点は、曖昧性を検出したら人間に判断を仰ぐこと。これが金融分析では最も重要
- Opus 4.7(複雑推論用)とSonnet 4.6(処理量が多い段階用)など、異なるClaudeモデルをパイプラインの各段階に適切に割り当てることで、品質とコストを最適化
- すべてのプロンプト変更やモデル更新を数千件のテストケースで検証する自動評価システムを構築。金融では「静かな誤り」が顧客を永遠に失う可能性がある
- プロバンナンス(追跡可能性)を最初から設計に組み込み、SOC 2認証など規制要件を満たす。小規模チームが大規模データを扱える根拠
💡 わかりやすく言うと…
従来のAIは「医者が患者の話を聞きながら同時に診断を下す」ようなもので、途中で聞き間違えると全体の診断が狂います。Keplerのやり方は「医者が質問を整理してから、別の検査機器で測定結果を確認する」という二段階設計。AIは複雑な質問を理解するのに専念し、実際の数値計算は誰が見ても正しい方法で確認するのです。