Anthropicが公開した、AI アシスタント「Claude」がコンピュータやブラウザを操作する際のベストプラクティスガイドです。最も重要なポイントは、スクリーンショット(画面の画像)をAPIに送信する前に適切なサイズに縮小することです。高解像度のままでは、APIの内部制限により自動的に圧縮され、モデルが見ている画像と実際のクリック座標がズレてしまいます。推奨解像度は1280×720ピクセルで、これによりクリック精度が大幅に向上します。その他にも、テキスト指示を画像の前に置く、座標を正しくスケーリングする、小さなUIэлементをズーム機能で拡大するなど、実装上の細かいテクニックが紹介されています。