醉裡挑燈看Code
pretty code
2026年5月31日 星期日
PDF 翻譯 Part 05
颶風翻了身
2026年5月24日 星期日
閒適臥雲中
2026年5月19日 星期二
PDF 翻譯 Part 04
2026年5月18日 星期一
PDF 翻譯 Part 03
PDF 翻譯 Part 02
先做:查你目前的狀態(5 分鐘)
查 Tier 在哪裡
方法 1:Console 介面
- 登入 console.anthropic.com
- 左側選單 → Settings → Limits(或 Plans & Billing)
- 會看到「Tier 1 / 2 / 3 / 4」字樣,以及對應的 RPM、ITPM、OTPM 數字
方法 2:用 curl 直接問 API(更準)
打開 cmd 或 PowerShell,把 YOUR_KEY 換成你的 API key:
curl https://api.anthropic.com/v1/organizations/rate_limits ^
-H "anthropic-version: 2023-06-01" ^
-H "x-api-key: YOUR_KEY"
回傳的 JSON 裡會直接告訴你每個模型的 RPM/ITPM/OTPM,對照下面的表就知道 Tier:
| Tier | Sonnet RPM | Sonnet ITPM |
|---|---|---|
| 1 | 50 | 30,000 |
| 2 | 1,000 | 80,000 |
| 3 | 2,000 | 800,000 |
| 4 | 4,000 | 2,000,000 |
查 prompt caching 有沒有開
直接搜你的翻譯工具程式碼,看 system 那段:
# 在你的翻譯工具資料夾
findstr /S "cache_control" *.py
- 有輸出 → 有開 caching
- 沒輸出 → 沒開 caching
或更簡單:跑一次翻譯,在你的程式裡 print 出 response.usage,看有沒有這兩個欄位:
cache_creation_input_tokens(第一次跑會有)cache_read_input_tokens(第二次以後會有)
兩個都是 0 → 沒開 caching。
然後:直接用 Batch API 改造你的工具
既然你選「注重速度,可以掛著等」,Batch API 是完美解答。我直接幫你準備好可以丟給 Claude Code 的修改說明。
Batch API 對你的好處(再次確認)
- ✅ 不受 RPM 限制 — 5,000 段一次提交也沒事
- ✅ 價格 5 折(input 和 output 都打 5 折)
- ✅ 24 小時保證,實測通常 1–2 小時
- ✅ 與 prompt caching 可疊加(更便宜)
- ⚠️ 結果是「全部一起回」,不能邊跑邊看
- ⚠️ 中途無法取消個別請求
改完之後的預期效果
以你 800 頁論文為例:
| 方案 | 時間 | 你需要在電腦旁 |
|---|---|---|
| 現況 | ~4 小時 | 全程 |
| + Prompt caching | ~3 小時 | 全程 |
| + Tier 升級 (-> 2) | ~30 分鐘 | 全程 |
| 改 Batch API | 1–2 小時 | 0 分鐘(掛著等) |
| Batch + Tier 升級 | 1–2 小時 | 0 分鐘 |
Batch API 對你的價值不只是「快」,而是「解放你的時間」 — 提交完就可以關電腦睡覺,醒來結果就在那。
成本方面:800 頁論文(假設 50 萬 input tokens、20 萬 output tokens)大致估算:
| 方案 | 預估成本(粗估) |
|---|---|
| 現況 | ~$4.50 |
| + Caching | ~$3.00 |
| + Batch API | ~$2.25 |
| Caching + Batch | ~$1.50 |
數字僅供參考,實際看你的文件密度。改完最多省 2/3 成本,外加 4 小時變 1-2 小時、還不用顧。
給你的執行順序建議
- 先查 Tier(用上面 curl 或 console)
- 新開 Claude Code session,把你的翻譯工具資料夾打開,把上面那段 prompt 貼進去
- 試跑一份小檔案(10-20 頁)驗證 batch 流程沒問題
- 正式跑 800 頁那份,掛著去睡覺
- 醒來檢查結果,用我們之前規劃的那個 PDF Compare Viewer 並排看 Google Translate 版 vs Claude API 版
整個工作流就完整了。
原來之前都在玩玩具
給你的實戰建議
根據這些數字,Pro 規劃工作流的原則:
1. 開新對話的時機
- 對話超過 20-30 輪就考慮開新對話
- 任務切換時開新對話(不要在同一對話跨多個專案)
- 把當下對話的「結論」貼到新對話起頭,可以用很少 tokens 換到清爽 context
2. 模型選擇策略
- 日常對話、寫文件:用 Sonnet(你目前模型 Opus 4.7 約 5x 貴)
- 複雜推理、艱難 debug:才用 Opus
- 如果只是「優化措辭」之類的小任務,可以切到 Haiku
3. 上傳檔案的成本意識
- 一份 800 頁 PDF(你的論文)一上傳可能就 200-400K tokens,超過 Pro 5 小時池子十倍
- 大檔案優先用 API 處理(你的翻譯工具就是對的方向)
- 想討論大檔內容,先用工具抽出關鍵段落,貼進 Claude 對話
4. 你目前的工作流估算
你過去這 6-7 輪我們的對話,加上 spec / prompts 文件產出,大概用掉 30-50K tokens。 意思是:這種「規劃 + 寫規格」的對話,一次 5 小時的 Pro 配額大概可以撐 2-3 個專案。
但如果你還要同時用 Claude Code 開發那個 PDF Viewer,Claude Code 燒很快(一次 1-2 小時的開發就可能吃完 5 小時池子)。
5. 撞牆時的判斷
| 情境 | 建議 |
|---|---|
| 每週撞 5 小時牆 1-2 次 | 改用「開新對話」「換 Sonnet」習慣 |
| 每週撞 3+ 次 | 認真考慮 Max 5x($100),ROI 大幅提升 |
| Claude Code 一天用 4+ 小時 | Max 5x 起跳,重度的話 Max 20x |
給你的核心收穫
Pro 5 小時 ≈ 44K tokens ≈ 30-50 則中等對話,這是你規劃工作的心理基準。
實務上你可以這樣抓:
- 「跟 Claude 規劃個東西、寫個規格」→ 30-50K tokens,剛好用滿 5 小時池子的一半到全部
- 「用 Claude Code 做半天開發」→ 容易撞牆
- 「上傳大檔深度分析」→ 一次就用很多,挑著用
如果你想更精確地監控,可以在 claude.ai 設定裡看 Usage 頁面(如果有開放給 Pro),或在 Claude Code 裡跑 /status 看當下用量。













