Keplerが金融サービス向けに検証可能なAIを構築した方法

原題: How Kepler built verifiable AI for financial services with Claude

📝 要約

金融企業向けAIプラットフォーム「Kepler Finance」は、2600万件以上のSEC提出資料や企業データを扱い、すべての数字を元の書類まで遡って検証できます。創業者たちは、従来のAIが計算結果を生成する際に間違いやすい問題を解決するため、AIの「推論層」と「検証層」を分離する設計を採用。Claudeに複雑な質問の分析と計画を任せ、実際の計算は決定的で検証可能なシステムで実行することで、金融規制環境で信頼できるAIを実現しました。わずか3ヶ月で14000社以上、27の市場のデータをインデックス化し、金融機関の「AIの結果をどう監査するのか」という根本的な課題に答えを出しています。

📌 ポイント

従来のAIは推論と計算を同時に行うため誤りが生じやすい。Keplerは「AIが考える」と「システムが計算する」を分離し、すべての数字を元の書類まで遡って検証可能にした
複雑な多段階の金融分析でClaude（推論モデル）が他のAIと異なる点は、曖昧性を検出したら人間に判断を仰ぐこと。これが金融分析では最も重要
Opus 4.7（複雑推論用）とSonnet 4.6（処理量が多い段階用）など、異なるClaudeモデルをパイプラインの各段階に適切に割り当てることで、品質とコストを最適化
すべてのプロンプト変更やモデル更新を数千件のテストケースで検証する自動評価システムを構築。金融では「静かな誤り」が顧客を永遠に失う可能性がある
プロバンナンス（追跡可能性）を最初から設計に組み込み、SOC 2認証など規制要件を満たす。小規模チームが大規模データを扱える根拠

💡 わかりやすく言うと…

従来のAIは「医者が患者の話を聞きながら同時に診断を下す」ようなもので、途中で聞き間違えると全体の診断が狂います。Keplerのやり方は「医者が質問を整理してから、別の検査機器で測定結果を確認する」という二段階設計。AIは複雑な質問を理解するのに専念し、実際の数値計算は誰が見ても正しい方法で確認するのです。