醉裡挑燈看Code: PDF 翻譯 Part 02

2026年5月18日星期一

PDF 翻譯 Part 02

前天使用自製工具翻譯了一份文件，大概快 900 頁，下面是 API 使用情況。

=== Summary ===

Paragraphs translated : 4186

Input tokens : 211,790

Output tokens : 302,468

Estimated cost : $7.0905 USD

還不賴，比一本書便宜。

另外，PDF 翻譯工具需改進，一個是動態調整 RPM 限制，另一個則是要考慮如何保存中間結果。

因為我遇到一個 5000 頁的文件，做到約 2250 頁時，系統當機，應該是我同時做很多事，導致記憶體用到快 16 G。

AI 給的 RPM 修改建議方向

先做：查你目前的狀態（5 分鐘）

查 Tier 在哪裡

方法 1：Console 介面

登入 console.anthropic.com
左側選單 → Settings → Limits（或 Plans & Billing）
會看到「Tier 1 / 2 / 3 / 4」字樣，以及對應的 RPM、ITPM、OTPM 數字

方法 2：用 curl 直接問 API（更準）

打開 cmd 或 PowerShell，把 YOUR_KEY 換成你的 API key：

curl https://api.anthropic.com/v1/organizations/rate_limits ^
  -H "anthropic-version: 2023-06-01" ^
  -H "x-api-key: YOUR_KEY"

回傳的 JSON 裡會直接告訴你每個模型的 RPM/ITPM/OTPM，對照下面的表就知道 Tier：

Tier	Sonnet RPM	Sonnet ITPM
1	50	30,000
2	1,000	80,000
3	2,000	800,000
4	4,000	2,000,000

查 prompt caching 有沒有開

直接搜你的翻譯工具程式碼，看 system 那段：

# 在你的翻譯工具資料夾
findstr /S "cache_control" *.py

有輸出 → 有開 caching
沒輸出 → 沒開 caching

或更簡單：跑一次翻譯，在你的程式裡 print 出 response.usage，看有沒有這兩個欄位：

cache_creation_input_tokens（第一次跑會有）
cache_read_input_tokens（第二次以後會有）

兩個都是 0 → 沒開 caching。

然後：直接用 Batch API 改造你的工具

既然你選「注重速度，可以掛著等」，Batch API 是完美解答。我直接幫你準備好可以丟給 Claude Code 的修改說明。

Batch API 對你的好處（再次確認）

✅ 不受 RPM 限制 — 5,000 段一次提交也沒事
✅ 價格 5 折（input 和 output 都打 5 折）
✅ 24 小時保證，實測通常 1–2 小時
✅ 與 prompt caching 可疊加（更便宜）
⚠️ 結果是「全部一起回」，不能邊跑邊看
⚠️ 中途無法取消個別請求

改完之後的預期效果

以你 800 頁論文為例：

方案	時間	你需要在電腦旁
現況	~4 小時	全程
+ Prompt caching	~3 小時	全程
+ Tier 升級 (-> 2)	~30 分鐘	全程
改 Batch API	1–2 小時	0 分鐘（掛著等）
Batch + Tier 升級	1–2 小時	0 分鐘

Batch API 對你的價值不只是「快」，而是「解放你的時間」 — 提交完就可以關電腦睡覺，醒來結果就在那。

成本方面：800 頁論文（假設 50 萬 input tokens、20 萬 output tokens）大致估算：

方案	預估成本（粗估）
現況	~$4.50
+ Caching	~$3.00
+ Batch API	~$2.25
Caching + Batch	~$1.50

數字僅供參考，實際看你的文件密度。改完最多省 2/3 成本，外加 4 小時變 1-2 小時、還不用顧。

給你的執行順序建議

先查 Tier（用上面 curl 或 console）
新開 Claude Code session，把你的翻譯工具資料夾打開，把上面那段 prompt 貼進去
試跑一份小檔案（10-20 頁）驗證 batch 流程沒問題
正式跑 800 頁那份，掛著去睡覺
醒來檢查結果，用我們之前規劃的那個 PDF Compare Viewer 並排看 Google Translate 版 vs Claude API 版

整個工作流就完整了。

沒有留言:

張貼留言

pretty code

2026年5月18日 星期一