第 123 期

Claude Code 揀啱 model 慳 70% 成本：Haiku 跑雜務、Sonnet 出 feature、Opus 做架構

進深·科技

第 123 期|Claude Code|創作者、打工仔|二〇二六年5月27日 · 星期三 · 農曆四月十一

Claude Code 預設用 Sonnet，月底見單先嚇親。其實 80% 嘅工作（改名、搬檔、樣板碼）Haiku 已經夠用。教你按工作揀 model：雜務用 Haiku、feature 用 Sonnet、架構先出 Opus，月費直接落 70%。

難度 ★★☆時間 30 分鐘用具 Claude Code CLI、Anthropic API key

【編者撰】一個香港人

情境

你裝咗 Claude Code 兩個月，每日用，工作流順到唔捨得放低。

第一個月單出嚟：US$340。

你嚇親。攤開 usage dashboard 望真啲：

70% token 用咗喺「改 variable 個名」、「搬 file」、「重新生成 test fixture」呢類雜務
20% 用喺日常 feature 開發
10% 用喺真係要諗嘢嘅架構 / 拆 bug

而呢三類工作，全部用緊同一個 model —— Sonnet 4.5。

呢個預設邏輯有問題：

Sonnet 強，但改一個 variable 個名都用佢係燒銀紙。Haiku 4.5 做呢樣嘢有 90% 質素，價錢得 1/4
真係要諗嘢嘅工作反而用緊「平衡型」。複雜嘅 race condition、棘手 refactor，你需要嘅係 Opus
Claude Code 識揀 model，但你冇教過佢點揀。佢只能用預設

呢篇教你建立「按工作揀 model」嘅做法。3 個 slash command、1 條 CLAUDE.md routing 規則、加 subagent 分派 —— 跟住做，下個月單落 50%-70%，質素冇跌反而升（因為複雜工作開始用 Opus）。

跟住做

1. 三隻 model 價錢對照 + 工作分類（5 分鐘）

先喺腦入面建立個概念。3 隻 model 嘅 input/output 價錢（每 1M tokens，2026 年 5 月報價）：

Model	Input	Output	適合
Haiku 4.5	US$1	US$5	雜務、平行工作、樣板碼
Sonnet 4.5	US$3	US$15	日常 feature 開發、code review
Opus 4.7	US$15	US$75	架構、複雜 debug、長篇推理

Opus output 係 Haiku 嘅 15 倍。但你日常根本唔需要 Opus 級數嘅推理。

工作對應 model：

Haiku：改名 / 搬 file、生成 test data、執靚 code 格式、寫 commit message、簡單 regex、grep 點寫
Sonnet：寫新 component、debug 邏輯 bug、refactor 一個 module、code review
Opus：揀架構（monolith 定 microservice）、race condition、performance 瓶頸、規劃跨 module 改動

2. 整 /haiku /sonnet /opus slash command（10 分鐘）

喺 project root 整個 .claude/commands/ 資料夾：

mkdir -p .claude/commands

整三個 slash command 檔案。.claude/commands/haiku.md：

---
description: Switch to Haiku 4.5 for grunt work
---

切去 Haiku 4.5。呢個 model 適合：rename、move、boilerplate、簡單 regex、generate test fixtures。

執行：`/model claude-haiku-4-5`

之後請用最直接方式完成 task，唔好過度解釋。

.claude/commands/sonnet.md：

---
description: Switch to Sonnet 4.5 for feature dev
---

切去 Sonnet 4.5。呢個係日常 default：寫 component、debug、refactor 一個 module。

執行：`/model claude-sonnet-4-5`

.claude/commands/opus.md：

---
description: Switch to Opus 4.7 for architecture / deep reasoning
---

切去 Opus 4.7。只用喺：architecture 決定、race condition、performance bottleneck、跨 module 規劃。

執行：`/model claude-opus-4-7`

之後用 extended thinking，思考多角度。

之後喺 Claude Code session 打 /haiku、/sonnet、/opus 就一秒切到。

3. CLAUDE.md routing 規則 + subagent 分派（10 分鐘）

喺 project root 嘅 CLAUDE.md 加一節：

## Model routing

Default：Sonnet 4.5。

升 / 降 model 嘅準則：
- Task 屬於 rename / move / boilerplate / format / 簡單 regex → 主動建議切 Haiku
- Task 涉及 architecture、race condition、跨 3+ files 嘅規劃 → 主動建議切 Opus
- 唔肯定 → 留喺 Sonnet

Subagent dispatch：
- 用 Task tool 分派 grunt sub-task 嗰陣，明確 spec `model: claude-haiku-4-5`
- 例如「rename 30 個 file 入面個 helper 名」、「regenerate 50 個 test fixture」 → 用 Haiku subagent 平行跑

之後你問 Claude「改晒呢個 service 入面所有 oldName」，Claude 會自己提：「呢個係雜務，建議 /haiku 切咗先做。」

Subagent 平行跑嘅例子（喺 prompt 入面寫）：

◉ 完整 prompt

分派 5 個 Haiku subagent 平行做以下嘢：
將 [src/services] 入面嘅 oldHelper 改名做 newHelper
更新 [src/components] 入面嘅 import path
重新生成 [tests/fixtures] 入面嘅 test fixture
更新 [docs/] 入面嘅文件引用
更新 CHANGELOG 一條紀錄
每個 subagent 用 model: claude-haiku-4-5，跑完匯總。

Haiku 平行跑 5 條，總成本可能仲低過用 Sonnet 順序做一條。

4. 每月成本檢視儀式（5 分鐘）

每月 1 號做：

開 console.anthropic.com → Usage
按 model 篩選睇分佈
健康比例：Haiku 50-60% / Sonnet 30-40% / Opus 5-10%
如果 Sonnet > 70% → 你啲雜務冇切 Haiku
如果 Opus > 20% → 你濫用 Opus，部分工作 Sonnet 已經做到

調整完，下個月再睇。3 個月之內，你會慢慢校準到最啱自己工作模式嘅分佈。

變化

變化 1：Solo dev 緊預算版

每月想壓喺 US$50 以下。預設反過嚟 —— 預設 Haiku，要升級先用 Sonnet。

CLAUDE.md：

## Model routing (budget mode)

Default：Haiku 4.5。
只有以下情況 escalate Sonnet：
- 寫新 feature（>50 行 new code）
- Debug 一個你形容係「tricky」嘅 bug
- 我明確打 /sonnet

絕對唔好自動切 Opus。我要用就會打 /opus。

呢個模式：質素稍稍跌少少、月費可以壓喺 US$30-50 之間。Side project / 學習階段啱用。

變化 2：Agency 多客戶版

接 5-10 個客戶，要分開計成本。每個客戶一個資料夾 + 一個 CLAUDE.md。

每個資料夾嘅 .env.local：

ANTHROPIC_API_KEY=sk-ant-...
ANTHROPIC_PROJECT_TAG=client-acme

Anthropic console 入面開「Projects」，每個客戶一個 project，分開計費。月底直接出 invoice 一條 line item。

Routing 規則按客戶嘅預算去調 —— 肯付錢嘅客戶容許用 Opus，慳得就慳嘅客戶預設 Haiku。

變化 3：學習版

你學緊新 framework / 新概念，唔係趕住交嘢。

策略反過嚟：

要解釋就用 Opus：你唔明嘅概念、想要深入解釋 → 直接 /opus。Opus 嘅解釋有層次、舉例又貼題
動手做就用 Sonnet：跟住寫 code、做練習 → Sonnet
重複操練就用 Haiku：生成 10 個變化例子、寫 flashcard → Haiku

學習階段「貴 model 用嚟解釋」其實划算 —— 你慳返嘅係「Google 唔到答案嗰兩個鐘」。

拆解：點解 work，同邊度會仆街

跟到上面就已經用得。下面呢段係畀**想由「跑一次 demo 慳到」做到「跑足一年都信得過」**嘅人——初學者可以跳過，唔影響你跟住做。

成本優化最唔老實嘅地方係：慳得太狠，省返嘅錢分分鐘賠返落去 debug 度。揀錯 model 唔會即刻爆畀你睇，係靜悄悄出錯。呢套 routing 做法，實際會喺呢幾個位仆街，你要預咗：

1. Haiku 靜靜雞做錯，你又信咗佢 你叫 Haiku 改名、搬 file，佢九成做得啱。但 grunt work 入面藏住唔係 grunt 嘅嘢——例如某個 oldName 撞正字串、注解、外部 config，要判斷先改得啱。Haiku 唔會話你知佢估緊。

會出事：改漏 / 改錯某幾處，typecheck 過到但 runtime 先爆，你以為慳咗錢，實情賠返成個鐘落去捉。
點救：grunt task 派去 Haiku 之前，先用 grep / search 確認個改動範圍係純機械式（純文字 replace、無語意判斷）。涉及判斷嘅，留返 Sonnet。改完一定要 typecheck + 跑 test 兜底，唔好淨係肉眼 review。

2. Subagent 平行跑，互相踩到對方隻腳 你派 5 個 Haiku subagent 平行改嘢，聽落好爽。但「改名」同「更新 import path」係有先後依賴嘅——A 未改完，B 已經去搵舊名，搵唔到。平行 ≠ 無序。

會出事：改到一半嘅中間狀態，import 指住已經唔存在嘅名，build 紅一片，你睇住一堆 error 唔知邊個 subagent 整出嚟。
點救：有依賴嘅步驟唔好夾硬平行。真正獨立嘅（例如改 5 個冇互相 import 嘅 file）先平行；有先後嘅就排住嚟。改完用一次完整 build 兜底，唔好信「每個 subagent 自己報 OK」。

3. 切咗 model，但 context 已經污糟咗 你喺同一個 session 由 Opus 傾完架構，順手 /haiku 落去做嘢。Haiku 接手嗰陣，前面 Opus 嘅長篇推理仲喺 context 入面——你慳咗 per-token 價，但條 context 又長又貴，慳幅冇你想像中大。

會出事：月底睇單，Haiku 比例上去咗，但總數冇跌幾多，你搞唔清點解。
點救：大型 grunt 批次，開新 session 或者 /clear 之後先切 Haiku 跑，唔好拖住一條長 context。架構討論同雜務分開 session 做。

4. 報價同 model 名會變，你寫死咗就過時 你篇 routing 規則寫死 claude-opus-4-7、寫死「Output 係 Haiku 15 倍」。但模型版本會 rev、報價會調、舊 model 會退役。寫死嘅嘢有日會靜靜變成錯。

會出事：某日 /model claude-opus-4-7 切唔到（model 改咗名 / 退役），command 靜靜失效，你照用住個唔啱嘅預設。
點救：唔好太依賴記住某個具體版本號或者某個價錢數字。每月做成本檢視嗰陣，順手對返 console 上面當下嘅 model 清單同報價；slash command 跑唔到就即刻 update。

5. 「慳到盡」嘅心魔，本身就係成本 最隱形嘅一個——你開始為咗慳幾蚊，喺切 model 上面花心神：呢個 task 算唔算 grunt？要唔要切？切完又後悔。呢啲決策疲勞，比你慳嗰幾蚊貴。

會出事：你花咗 30 秒諗「應該用邊隻」，慳返嘅可能係 US$0.02。時間嘅機會成本遠高過 token 差價。
點救：唔肯定就留喺 Sonnet，唔好諗。Routing 只值得花心神喺「明顯係大批 grunt」同「明顯要深度推理」呢兩極；中間灰色地帶，default 行先，月底睇單再校準。

呢幾個位，就係「跑一次 demo 慳到」同「跑足一年都慳得又信得過」之間嘅距離。

一個心態

預設係畀唔識揀嘅人用嘅。識揀嘅人，每件工作都揀啱工具。

Claude Code 預設 Sonnet 唔係佢嘅錯 —— 係佢未識你嘅工作模式。你裝嘅第一日，佢冇辦法分得清「改名」同「架構」對你嘅難度差幾遠。

但兩個月之後，你應該識自己。應該知道：

自己 70% 時間做緊咩
邊類工作真係需要推理
邊類工作只係要「快、準、唔錯」

按工作揀 model 嘅意義唔係慳錢 —— 慳錢只係順帶嘅好處。真正意義係：你開始當 AI 係工具，唔再當佢係萬能嘅 oracle。Haiku 處理雜務、Sonnet 出活、Opus 做要諗嘢嘅深度工作 —— 你個腦本身都係咁分工。

最後提醒：

✅ 第 1 個月實驗，第 2 個月固定比例。唔好一裝咗 routing 規則就期待即刻慳 70%
⚠️ 唔好過度執到盡。為咗慳 US$5 打 30 次 /haiku 切過嚟切過去，唔抵
🎯 /cost 喺 session 入面睇即時 token 消耗。一件工作跑完檢查一次，幾日就校準到

下個鐘整 3 個 slash command + 改 CLAUDE.md。月底先睇單對比。

◉

文中工具 · 連結

Claude Code CLI· 付費
開發者用 — terminal 入面同 Claude pair coding
Anthropic API key· 付費
攞 API key 用 Claude Code / 接落自己 app

睇完想同 Claude 一齊行一次？

撳一撳，就將成段 tutor 指示（連埋成篇文嘅內容）抄入剪貼簿。貼入 Claude.ai 或 Claude Desktop，佢會用廣東話帶你一步一步行，每步問你填關鍵位，最後畀返一個專為你情況寫嘅 prompt 帶走。

◉下期預告 · 相關情境

Claude Code 揀啱 model 慳 70% 成本：Haiku 跑雜務、Sonnet 出 feature、Opus 做架構

情境

跟住做

1. 三隻 model 價錢對照 + 工作分類（5 分鐘）

2. 整 /haiku /sonnet /opus slash command（10 分鐘）

3. CLAUDE.md routing 規則 + subagent 分派（10 分鐘）

4. 每月成本檢視儀式（5 分鐘）

變化

變化 1：Solo dev 緊預算版

變化 2：Agency 多客戶版

變化 3：學習版

拆解：點解 work，同邊度會仆街

一個心態

文中工具 · 連結

睇完想同 Claude 一齊行一次？

Claude Code 由零安裝：Mac / Linux 30 分鐘起第一個 project

Claude Code Subagents：5 個 agent 並行同時做嘢（重構 + 測試 + 寫文檔）

Claude Code 唔使開 terminal 都跑得：headless + cron 起夜貓自動化 workflow

Claude Code 揀啱 model 慳 70% 成本：Haiku 跑雜務、Sonnet 出 feature、Opus 做架構

情境

跟住做

1. 三隻 model 價錢對照 + 工作分類（5 分鐘）

2. 整 /haiku /sonnet /opus slash command（10 分鐘）

3. CLAUDE.md routing 規則 + subagent 分派（10 分鐘）

4. 每月成本檢視儀式（5 分鐘）

變化

變化 1：Solo dev 緊預算版

變化 2：Agency 多客戶版

變化 3：學習版

拆解：點解 work，同邊度會仆街

一個心態

文中工具 · 連結

睇完想同 Claude 一齊行一次？

Claude Code 由零安裝：Mac / Linux 30 分鐘起第一個 project

Claude Code Subagents：5 個 agent 並行同時做嘢（重構 + 測試 + 寫文檔）

Claude Code 唔使開 terminal 都跑得：headless + cron 起夜貓自動化 workflow

每週日早上，一道新菜送到你 inbox。

每週日早上，
一道新菜送到你 inbox。