醉裡挑燈看Code
pretty code
2026年5月18日 星期一
PDF 翻譯 Part 03
PDF 翻譯 Part 02
先做:查你目前的狀態(5 分鐘)
查 Tier 在哪裡
方法 1:Console 介面
- 登入 console.anthropic.com
- 左側選單 → Settings → Limits(或 Plans & Billing)
- 會看到「Tier 1 / 2 / 3 / 4」字樣,以及對應的 RPM、ITPM、OTPM 數字
方法 2:用 curl 直接問 API(更準)
打開 cmd 或 PowerShell,把 YOUR_KEY 換成你的 API key:
curl https://api.anthropic.com/v1/organizations/rate_limits ^
-H "anthropic-version: 2023-06-01" ^
-H "x-api-key: YOUR_KEY"
回傳的 JSON 裡會直接告訴你每個模型的 RPM/ITPM/OTPM,對照下面的表就知道 Tier:
| Tier | Sonnet RPM | Sonnet ITPM |
|---|---|---|
| 1 | 50 | 30,000 |
| 2 | 1,000 | 80,000 |
| 3 | 2,000 | 800,000 |
| 4 | 4,000 | 2,000,000 |
查 prompt caching 有沒有開
直接搜你的翻譯工具程式碼,看 system 那段:
# 在你的翻譯工具資料夾
findstr /S "cache_control" *.py
- 有輸出 → 有開 caching
- 沒輸出 → 沒開 caching
或更簡單:跑一次翻譯,在你的程式裡 print 出 response.usage,看有沒有這兩個欄位:
cache_creation_input_tokens(第一次跑會有)cache_read_input_tokens(第二次以後會有)
兩個都是 0 → 沒開 caching。
然後:直接用 Batch API 改造你的工具
既然你選「注重速度,可以掛著等」,Batch API 是完美解答。我直接幫你準備好可以丟給 Claude Code 的修改說明。
Batch API 對你的好處(再次確認)
- ✅ 不受 RPM 限制 — 5,000 段一次提交也沒事
- ✅ 價格 5 折(input 和 output 都打 5 折)
- ✅ 24 小時保證,實測通常 1–2 小時
- ✅ 與 prompt caching 可疊加(更便宜)
- ⚠️ 結果是「全部一起回」,不能邊跑邊看
- ⚠️ 中途無法取消個別請求
改完之後的預期效果
以你 800 頁論文為例:
| 方案 | 時間 | 你需要在電腦旁 |
|---|---|---|
| 現況 | ~4 小時 | 全程 |
| + Prompt caching | ~3 小時 | 全程 |
| + Tier 升級 (-> 2) | ~30 分鐘 | 全程 |
| 改 Batch API | 1–2 小時 | 0 分鐘(掛著等) |
| Batch + Tier 升級 | 1–2 小時 | 0 分鐘 |
Batch API 對你的價值不只是「快」,而是「解放你的時間」 — 提交完就可以關電腦睡覺,醒來結果就在那。
成本方面:800 頁論文(假設 50 萬 input tokens、20 萬 output tokens)大致估算:
| 方案 | 預估成本(粗估) |
|---|---|
| 現況 | ~$4.50 |
| + Caching | ~$3.00 |
| + Batch API | ~$2.25 |
| Caching + Batch | ~$1.50 |
數字僅供參考,實際看你的文件密度。改完最多省 2/3 成本,外加 4 小時變 1-2 小時、還不用顧。
給你的執行順序建議
- 先查 Tier(用上面 curl 或 console)
- 新開 Claude Code session,把你的翻譯工具資料夾打開,把上面那段 prompt 貼進去
- 試跑一份小檔案(10-20 頁)驗證 batch 流程沒問題
- 正式跑 800 頁那份,掛著去睡覺
- 醒來檢查結果,用我們之前規劃的那個 PDF Compare Viewer 並排看 Google Translate 版 vs Claude API 版
整個工作流就完整了。
原來之前都在玩玩具
給你的實戰建議
根據這些數字,Pro 規劃工作流的原則:
1. 開新對話的時機
- 對話超過 20-30 輪就考慮開新對話
- 任務切換時開新對話(不要在同一對話跨多個專案)
- 把當下對話的「結論」貼到新對話起頭,可以用很少 tokens 換到清爽 context
2. 模型選擇策略
- 日常對話、寫文件:用 Sonnet(你目前模型 Opus 4.7 約 5x 貴)
- 複雜推理、艱難 debug:才用 Opus
- 如果只是「優化措辭」之類的小任務,可以切到 Haiku
3. 上傳檔案的成本意識
- 一份 800 頁 PDF(你的論文)一上傳可能就 200-400K tokens,超過 Pro 5 小時池子十倍
- 大檔案優先用 API 處理(你的翻譯工具就是對的方向)
- 想討論大檔內容,先用工具抽出關鍵段落,貼進 Claude 對話
4. 你目前的工作流估算
你過去這 6-7 輪我們的對話,加上 spec / prompts 文件產出,大概用掉 30-50K tokens。 意思是:這種「規劃 + 寫規格」的對話,一次 5 小時的 Pro 配額大概可以撐 2-3 個專案。
但如果你還要同時用 Claude Code 開發那個 PDF Viewer,Claude Code 燒很快(一次 1-2 小時的開發就可能吃完 5 小時池子)。
5. 撞牆時的判斷
| 情境 | 建議 |
|---|---|
| 每週撞 5 小時牆 1-2 次 | 改用「開新對話」「換 Sonnet」習慣 |
| 每週撞 3+ 次 | 認真考慮 Max 5x($100),ROI 大幅提升 |
| Claude Code 一天用 4+ 小時 | Max 5x 起跳,重度的話 Max 20x |
給你的核心收穫
Pro 5 小時 ≈ 44K tokens ≈ 30-50 則中等對話,這是你規劃工作的心理基準。
實務上你可以這樣抓:
- 「跟 Claude 規劃個東西、寫個規格」→ 30-50K tokens,剛好用滿 5 小時池子的一半到全部
- 「用 Claude Code 做半天開發」→ 容易撞牆
- 「上傳大檔深度分析」→ 一次就用很多,挑著用
如果你想更精確地監控,可以在 claude.ai 設定裡看 Usage 頁面(如果有開放給 Pro),或在 Claude Code 裡跑 /status 看當下用量。
2026年5月16日 星期六
PDF 翻譯 Part 01
英文技術文件翻譯成中文:5 個最佳方案
針對技術文件的完整翻譯,我為你整理了五個經過實測效果不錯的方案,並依照不同使用情境分類。
方案一:Claude / ChatGPT / Gemini(大型語言模型)
直接將文件內容貼到對話框,或上傳檔案請 AI 翻譯。
優點
- 翻譯品質目前在技術文件領域是最高的,能理解上下文、保留技術術語的一致性
- 可以下指令客製化,例如「保留程式碼區塊不翻譯」、「使用台灣繁中習慣用語」、「術語表優先」
- 能處理 Markdown、HTML 等格式,輸出後排版幾乎不需要再整理
- 遇到模糊語意時會根據語境合理判斷,而非機械式直譯
缺點
- 長文件需要分段處理,否則容易遇到輸出長度限制(通常一次 3000–5000 字較穩定)
- 不同段落之間的術語一致性需要自己維護術語表,或在 prompt 中明確指定
- 免費版本通常有用量限制,重度使用需要訂閱
- 偶爾會出現幻覺,特別是專有名詞或版本號,需要人工校對
最適合: 重視翻譯品質、文件量中等(一份文件數千到數萬字)、願意動手調整 prompt 的人。
方案二:DeepL(含 DeepL Pro / DeepL Document Translator)
專注於翻譯的服務,支援 .docx、.pptx、.pdf、.txt 等檔案上傳,整份翻譯後下載。
優點
- 翻譯流暢度極佳,中文輸出比 Google 翻譯更自然
- 文件上傳後會完整保留原始排版(字型、表格、圖片位置)
- 操作極簡,零學習成本
- 有 API 可串接到自己的工作流程
缺點
- 對於最新的技術術語(特別是 AI、區塊鏈等新領域)有時不如 LLM 精準
- 免費版有每月字數和檔案大小限制(單檔約 5MB、每月 3 份)
- 無法針對特定術語做客製化翻譯記憶(這是 Pro 才有的 Glossary 功能)
- 對程式碼區塊的處理不如 LLM 細緻,有時會誤譯變數名稱
最適合: 需要保留原始檔案排版、追求穩定輸出、不想花時間調整參數的人。
方案三:Immersive Translate(沉浸式翻譯)瀏覽器擴充功能
主要用於網頁翻譯,但也支援 PDF、EPUB 等文件,採雙語對照顯示。
優點
- 雙語對照模式對技術文件閱讀極友善,原文與譯文並列方便核對
- 可以串接多種翻譯引擎(Google、DeepL、OpenAI、Claude、自訂 API 等)
- 支援線上文件(GitHub README、官方文件網站)即時翻譯
- PDF 翻譯保留原始排版,輸出雙語 PDF
- 免費版功能已足夠日常使用
缺點
- 串接 OpenAI/Claude API 需要自己申請金鑰並支付費用
- PDF 翻譯的進階功能(如完整檔案翻譯下載)需要 Pro 訂閱
- 對於要交付的「翻譯成果」不是最佳選擇,比較適合自己閱讀
- 排版複雜的 PDF 偶爾會出現對位錯誤
最適合: 主要是「自己要看懂」技術文件、會頻繁瀏覽英文網頁文件、想要保留原文對照的人。
方案四:Crowdin / Lokalise / Weblate(專業在地化平台)
針對軟體與技術文件設計的協作翻譯平台,支援多種檔案格式(Markdown、JSON、PO、XLIFF 等)。
優點
- 有完整的翻譯記憶庫(TM)和術語表(Glossary)功能,確保跨文件術語一致
- 支援團隊協作、版本控管、審校流程
- 可直接串接 GitHub/GitLab,文件更新時自動同步
- 整合機器翻譯(MT)作為初稿,再由人工校對
- 適合長期維護的文件專案
缺點
- 學習曲線較陡,初次設定需要花時間
- 主要為團隊與企業設計,個人偶爾使用過於笨重
- 免費方案限制較多(Crowdin 有開源專案免費方案,Lokalise 沒有真正的免費版)
- 不適合一次性的翻譯任務
最適合: 持續維護的技術文件(如開源專案 docs、產品手冊)、團隊協作、需要版本控管的場景。
方案五:Google 翻譯(含 Google Docs 內建翻譯 / Google 文件翻譯)
老牌通用翻譯工具,可直接上傳文件或在 Google Docs 中使用「翻譯文件」功能。
優點
- 完全免費,無使用量限制
- 支援格式廣泛,文件上傳可保留基本排版
- 速度極快,整份文件幾秒鐘完成
- 與 Google Workspace 整合良好
缺點
- 翻譯品質在技術文件上明顯落後於 DeepL 和 LLM,中文常有「翻譯腔」
- 不擅長處理技術術語,有時會把專有名詞硬譯
- 無法客製化術語或語氣
- 程式碼區塊處理粗糙
最適合: 對品質要求不高、需要快速理解大意、預算為零的場景。
我的建議組合
如果是要交付的正式翻譯成果,實務上最有效率的做法是混搭:
LLM(Claude/ChatGPT)做初翻 → 人工校對 → DeepL 或 Immersive Translate 對照檢查
如果你能告訴我這份技術文件的類型(API 文件?產品手冊?學術論文?)、長度,以及翻譯後的用途(自己看 / 交付給客戶 / 發佈),我可以給你更具體的方案推薦。










