=== Summary ===
Paragraphs translated : 4186
Input tokens : 211,790
Output tokens : 302,468
Estimated cost : $7.0905 USD
還不賴,比一本書便宜。
另外,PDF 翻譯工具需改進,一個是動態調整 RPM 限制,另一個則是要考慮如何保存中間結果。
因為我遇到一個 5000 頁的文件,做到約 2250 頁時,系統當機,應該是我同時做很多事,導致記憶體用到快 16 G。
AI 給的 RPM 修改建議方向
先做:查你目前的狀態(5 分鐘)
查 Tier 在哪裡
方法 1:Console 介面
- 登入 console.anthropic.com
- 左側選單 → Settings → Limits(或 Plans & Billing)
- 會看到「Tier 1 / 2 / 3 / 4」字樣,以及對應的 RPM、ITPM、OTPM 數字
方法 2:用 curl 直接問 API(更準)
打開 cmd 或 PowerShell,把 YOUR_KEY 換成你的 API key:
curl https://api.anthropic.com/v1/organizations/rate_limits ^
-H "anthropic-version: 2023-06-01" ^
-H "x-api-key: YOUR_KEY"
回傳的 JSON 裡會直接告訴你每個模型的 RPM/ITPM/OTPM,對照下面的表就知道 Tier:
| Tier | Sonnet RPM | Sonnet ITPM |
|---|---|---|
| 1 | 50 | 30,000 |
| 2 | 1,000 | 80,000 |
| 3 | 2,000 | 800,000 |
| 4 | 4,000 | 2,000,000 |
查 prompt caching 有沒有開
直接搜你的翻譯工具程式碼,看 system 那段:
# 在你的翻譯工具資料夾
findstr /S "cache_control" *.py
- 有輸出 → 有開 caching
- 沒輸出 → 沒開 caching
或更簡單:跑一次翻譯,在你的程式裡 print 出 response.usage,看有沒有這兩個欄位:
cache_creation_input_tokens(第一次跑會有)cache_read_input_tokens(第二次以後會有)
兩個都是 0 → 沒開 caching。
然後:直接用 Batch API 改造你的工具
既然你選「注重速度,可以掛著等」,Batch API 是完美解答。我直接幫你準備好可以丟給 Claude Code 的修改說明。
Batch API 對你的好處(再次確認)
- ✅ 不受 RPM 限制 — 5,000 段一次提交也沒事
- ✅ 價格 5 折(input 和 output 都打 5 折)
- ✅ 24 小時保證,實測通常 1–2 小時
- ✅ 與 prompt caching 可疊加(更便宜)
- ⚠️ 結果是「全部一起回」,不能邊跑邊看
- ⚠️ 中途無法取消個別請求
改完之後的預期效果
以你 800 頁論文為例:
| 方案 | 時間 | 你需要在電腦旁 |
|---|---|---|
| 現況 | ~4 小時 | 全程 |
| + Prompt caching | ~3 小時 | 全程 |
| + Tier 升級 (-> 2) | ~30 分鐘 | 全程 |
| 改 Batch API | 1–2 小時 | 0 分鐘(掛著等) |
| Batch + Tier 升級 | 1–2 小時 | 0 分鐘 |
Batch API 對你的價值不只是「快」,而是「解放你的時間」 — 提交完就可以關電腦睡覺,醒來結果就在那。
成本方面:800 頁論文(假設 50 萬 input tokens、20 萬 output tokens)大致估算:
| 方案 | 預估成本(粗估) |
|---|---|
| 現況 | ~$4.50 |
| + Caching | ~$3.00 |
| + Batch API | ~$2.25 |
| Caching + Batch | ~$1.50 |
數字僅供參考,實際看你的文件密度。改完最多省 2/3 成本,外加 4 小時變 1-2 小時、還不用顧。
給你的執行順序建議
- 先查 Tier(用上面 curl 或 console)
- 新開 Claude Code session,把你的翻譯工具資料夾打開,把上面那段 prompt 貼進去
- 試跑一份小檔案(10-20 頁)驗證 batch 流程沒問題
- 正式跑 800 頁那份,掛著去睡覺
- 醒來檢查結果,用我們之前規劃的那個 PDF Compare Viewer 並排看 Google Translate 版 vs Claude API 版
整個工作流就完整了。

沒有留言:
張貼留言