
Claude Code 揀啱 model 慳 70% 成本:Haiku 跑雜務、Sonnet 出 feature、Opus 做架構
Claude Code 預設用 Sonnet,月底見單先嚇親。其實 80% 嘅工作(改名、搬檔、樣板碼)Haiku 已經夠用。教你按工作揀 model:雜務用 Haiku、feature 用 Sonnet、架構先出 Opus,月費直接落 70%。
情境
你裝咗 Claude Code 兩個月,每日用,工作流順到唔捨得放低。
第一個月單出嚟:US$340。
你嚇親。攤開 usage dashboard 望真啲:
- 70% token 用咗喺「改 variable 個名」、「搬 file」、「重新生成 test fixture」呢類雜務
- 20% 用喺日常 feature 開發
- 10% 用喺真係要諗嘢嘅架構 / 拆 bug
而呢三類工作,全部用緊同一個 model —— Sonnet 4.5。
呢個預設邏輯有問題:
- Sonnet 強,但改一個 variable 個名都用佢係燒銀紙。Haiku 4.5 做呢樣嘢有 90% 質素,價錢得 1/4
- 真係要諗嘢嘅工作反而用緊「平衡型」。複雜嘅 race condition、棘手 refactor,你需要嘅係 Opus
- Claude Code 識揀 model,但你冇教過佢點揀。佢只能用預設
呢篇教你建立「按工作揀 model」嘅做法。3 個 slash command、1 條 CLAUDE.md routing 規則、加 subagent 分派 —— 跟住做,下個月單落 50%-70%,質素冇跌反而升(因為複雜工作開始用 Opus)。
跟住做
1. 三隻 model 價錢對照 + 工作分類(5 分鐘)
先喺腦入面建立個概念。3 隻 model 嘅 input/output 價錢(每 1M tokens,2026 年 5 月報價):
| Model | Input | Output | 適合 |
|---|---|---|---|
| Haiku 4.5 | US$1 | US$5 | 雜務、平行工作、樣板碼 |
| Sonnet 4.5 | US$3 | US$15 | 日常 feature 開發、code review |
| Opus 4.7 | US$15 | US$75 | 架構、複雜 debug、長篇推理 |
Opus output 係 Haiku 嘅 15 倍。但你日常根本唔需要 Opus 級數嘅推理。
工作對應 model:
- Haiku:改名 / 搬 file、生成 test data、執靚 code 格式、寫 commit message、簡單 regex、grep 點寫
- Sonnet:寫新 component、debug 邏輯 bug、refactor 一個 module、code review
- Opus:揀架構(monolith 定 microservice)、race condition、performance 瓶頸、規劃跨 module 改動
2. 整 /haiku /sonnet /opus slash command(10 分鐘)
喺 project root 整個 .claude/commands/ 資料夾:
mkdir -p .claude/commands
整三個 slash command 檔案。.claude/commands/haiku.md:
---
description: Switch to Haiku 4.5 for grunt work
---
切去 Haiku 4.5。呢個 model 適合:rename、move、boilerplate、簡單 regex、generate test fixtures。
執行:`/model claude-haiku-4-5`
之後請用最直接方式完成 task,唔好過度解釋。
.claude/commands/sonnet.md:
---
description: Switch to Sonnet 4.5 for feature dev
---
切去 Sonnet 4.5。呢個係日常 default:寫 component、debug、refactor 一個 module。
執行:`/model claude-sonnet-4-5`
.claude/commands/opus.md:
---
description: Switch to Opus 4.7 for architecture / deep reasoning
---
切去 Opus 4.7。只用喺:architecture 決定、race condition、performance bottleneck、跨 module 規劃。
執行:`/model claude-opus-4-7`
之後用 extended thinking,思考多角度。
之後喺 Claude Code session 打 /haiku、/sonnet、/opus 就一秒切到。
3. CLAUDE.md routing 規則 + subagent 分派(10 分鐘)
喺 project root 嘅 CLAUDE.md 加一節:
## Model routing
Default:Sonnet 4.5。
升 / 降 model 嘅準則:
- Task 屬於 rename / move / boilerplate / format / 簡單 regex → 主動建議切 Haiku
- Task 涉及 architecture、race condition、跨 3+ files 嘅規劃 → 主動建議切 Opus
- 唔肯定 → 留喺 Sonnet
Subagent dispatch:
- 用 Task tool 分派 grunt sub-task 嗰陣,明確 spec `model: claude-haiku-4-5`
- 例如「rename 30 個 file 入面個 helper 名」、「regenerate 50 個 test fixture」 → 用 Haiku subagent 平行跑
之後你問 Claude「改晒呢個 service 入面所有 oldName」,Claude 會自己提:「呢個係雜務,建議 /haiku 切咗先做。」
Subagent 平行跑嘅例子(喺 prompt 入面寫):
分派 5 個 Haiku subagent 平行做以下嘢: 將 [src/services] 入面嘅 oldHelper 改名做 newHelper 更新 [src/components] 入面嘅 import path 重新生成 [tests/fixtures] 入面嘅 test fixture 更新 [docs/] 入面嘅文件引用 更新 CHANGELOG 一條紀錄 每個 subagent 用 model: claude-haiku-4-5,跑完匯總。
Haiku 平行跑 5 條,總成本可能仲低過用 Sonnet 順序做一條。
4. 每月成本檢視儀式(5 分鐘)
每月 1 號做:
- 開 console.anthropic.com → Usage
- 按 model 篩選睇分佈
- 健康比例:Haiku 50-60% / Sonnet 30-40% / Opus 5-10%
- 如果 Sonnet > 70% → 你啲雜務冇切 Haiku
- 如果 Opus > 20% → 你濫用 Opus,部分工作 Sonnet 已經做到
調整完,下個月再睇。3 個月之內,你會慢慢校準到最啱自己工作模式嘅分佈。
變化
變化 1:Solo dev 緊預算版
每月想壓喺 US$50 以下。預設反過嚟 —— 預設 Haiku,要升級先用 Sonnet。
CLAUDE.md:
## Model routing (budget mode)
Default:Haiku 4.5。
只有以下情況 escalate Sonnet:
- 寫新 feature(>50 行 new code)
- Debug 一個你形容係「tricky」嘅 bug
- 我明確打 /sonnet
絕對唔好自動切 Opus。我要用就會打 /opus。
呢個模式:質素稍稍跌少少、月費可以壓喺 US$30-50 之間。Side project / 學習階段啱用。
變化 2:Agency 多客戶版
接 5-10 個客戶,要分開計成本。每個客戶一個資料夾 + 一個 CLAUDE.md。
每個資料夾嘅 .env.local:
ANTHROPIC_API_KEY=sk-ant-...
ANTHROPIC_PROJECT_TAG=client-acme
Anthropic console 入面開「Projects」,每個客戶一個 project,分開計費。月底直接出 invoice 一條 line item。
Routing 規則按客戶嘅預算去調 —— 肯付錢嘅客戶容許用 Opus,慳得就慳嘅客戶預設 Haiku。
變化 3:學習版
你學緊新 framework / 新概念,唔係趕住交嘢。
策略反過嚟:
- 要解釋就用 Opus:你唔明嘅概念、想要深入解釋 → 直接
/opus。Opus 嘅解釋有層次、舉例又貼題 - 動手做就用 Sonnet:跟住寫 code、做練習 → Sonnet
- 重複操練就用 Haiku:生成 10 個變化例子、寫 flashcard → Haiku
學習階段「貴 model 用嚟解釋」其實划算 —— 你慳返嘅係「Google 唔到答案嗰兩個鐘」。
拆解:點解 work,同邊度會仆街
跟到上面就已經用得。下面呢段係畀**想由「跑一次 demo 慳到」做到「跑足一年都信得過」**嘅人——初學者可以跳過,唔影響你跟住做。
成本優化最唔老實嘅地方係:慳得太狠,省返嘅錢分分鐘賠返落去 debug 度。揀錯 model 唔會即刻爆畀你睇,係靜悄悄出錯。呢套 routing 做法,實際會喺呢幾個位仆街,你要預咗:
1. Haiku 靜靜雞做錯,你又信咗佢
你叫 Haiku 改名、搬 file,佢九成做得啱。但 grunt work 入面藏住唔係 grunt 嘅嘢——例如某個 oldName 撞正字串、注解、外部 config,要判斷先改得啱。Haiku 唔會話你知佢估緊。
- 會出事:改漏 / 改錯某幾處,typecheck 過到但 runtime 先爆,你以為慳咗錢,實情賠返成個鐘落去捉。
- 點救:grunt task 派去 Haiku 之前,先用 grep / search 確認個改動範圍係純機械式(純文字 replace、無語意判斷)。涉及判斷嘅,留返 Sonnet。改完一定要 typecheck + 跑 test 兜底,唔好淨係肉眼 review。
2. Subagent 平行跑,互相踩到對方隻腳 你派 5 個 Haiku subagent 平行改嘢,聽落好爽。但「改名」同「更新 import path」係有先後依賴嘅——A 未改完,B 已經去搵舊名,搵唔到。平行 ≠ 無序。
- 會出事:改到一半嘅中間狀態,import 指住已經唔存在嘅名,build 紅一片,你睇住一堆 error 唔知邊個 subagent 整出嚟。
- 點救:有依賴嘅步驟唔好夾硬平行。真正獨立嘅(例如改 5 個冇互相 import 嘅 file)先平行;有先後嘅就排住嚟。改完用一次完整 build 兜底,唔好信「每個 subagent 自己報 OK」。
3. 切咗 model,但 context 已經污糟咗
你喺同一個 session 由 Opus 傾完架構,順手 /haiku 落去做嘢。Haiku 接手嗰陣,前面 Opus 嘅長篇推理仲喺 context 入面——你慳咗 per-token 價,但條 context 又長又貴,慳幅冇你想像中大。
- 會出事:月底睇單,Haiku 比例上去咗,但總數冇跌幾多,你搞唔清點解。
- 點救:大型 grunt 批次,開新 session 或者
/clear之後先切 Haiku 跑,唔好拖住一條長 context。架構討論同雜務分開 session 做。
4. 報價同 model 名會變,你寫死咗就過時
你篇 routing 規則寫死 claude-opus-4-7、寫死「Output 係 Haiku 15 倍」。但模型版本會 rev、報價會調、舊 model 會退役。寫死嘅嘢有日會靜靜變成錯。
- 會出事:某日
/model claude-opus-4-7切唔到(model 改咗名 / 退役),command 靜靜失效,你照用住個唔啱嘅預設。 - 點救:唔好太依賴記住某個具體版本號或者某個價錢數字。每月做成本檢視嗰陣,順手對返 console 上面當下嘅 model 清單同報價;slash command 跑唔到就即刻 update。
5. 「慳到盡」嘅心魔,本身就係成本 最隱形嘅一個——你開始為咗慳幾蚊,喺切 model 上面花心神:呢個 task 算唔算 grunt?要唔要切?切完又後悔。呢啲決策疲勞,比你慳嗰幾蚊貴。
- 會出事:你花咗 30 秒諗「應該用邊隻」,慳返嘅可能係 US$0.02。時間嘅機會成本遠高過 token 差價。
- 點救:唔肯定就留喺 Sonnet,唔好諗。Routing 只值得花心神喺「明顯係大批 grunt」同「明顯要深度推理」呢兩極;中間灰色地帶,default 行先,月底睇單再校準。
呢幾個位,就係「跑一次 demo 慳到」同「跑足一年都慳得又信得過」之間嘅距離。
一個心態
預設係畀唔識揀嘅人用嘅。識揀嘅人,每件工作都揀啱工具。
Claude Code 預設 Sonnet 唔係佢嘅錯 —— 係佢未識你嘅工作模式。你裝嘅第一日,佢冇辦法分得清「改名」同「架構」對你嘅難度差幾遠。
但兩個月之後,你應該識自己。應該知道:
- 自己 70% 時間做緊咩
- 邊類工作真係需要推理
- 邊類工作只係要「快、準、唔錯」
按工作揀 model 嘅意義唔係慳錢 —— 慳錢只係順帶嘅好處。真正意義係:你開始當 AI 係工具,唔再當佢係萬能嘅 oracle。Haiku 處理雜務、Sonnet 出活、Opus 做要諗嘢嘅深度工作 —— 你個腦本身都係咁分工。
最後提醒:
- ✅ 第 1 個月實驗,第 2 個月固定比例。唔好一裝咗 routing 規則就期待即刻慳 70%
- ⚠️ 唔好過度執到盡。為咗慳 US$5 打 30 次
/haiku切過嚟切過去,唔抵 - 🎯
/cost喺 session 入面睇即時 token 消耗。一件工作跑完檢查一次,幾日就校準到
下個鐘整 3 個 slash command + 改 CLAUDE.md。月底先睇單對比。
文中工具 · 連結
- Claude Code CLI· 付費
開發者用 — terminal 入面同 Claude pair coding
攞 API key 用 Claude Code / 接落自己 app
睇完想同 Claude 一齊行一次?
撳一撳,就將成段 tutor 指示(連埋成篇文嘅內容)抄入剪貼簿。 貼入 Claude.ai 或 Claude Desktop,佢會用廣東話帶你一步一步行, 每步問你填關鍵位,最後畀返一個專為你情況寫嘅 prompt 帶走。
- 創作者 · 30 分鐘
Claude Code 由零安裝:Mac / Linux 30 分鐘起第一個 project
你睇 Twitter / HN 講 Claude Code,但搜尋「install」出咗 5 個矛盾教學,唔知由邊度開始。呢篇 30 分鐘有系統咁裝好 —— Mac / Linux 設定、API key、第一個 project 跑起、權限設定、常見安裝錯誤拆解。
- 創作者 · 30 分鐘
Claude Code Subagents:5 個 agent 並行同時做嘢(重構 + 測試 + 寫文檔)
睇個大 PR 順序做要 30 分鐘。用 subagent 並行:程式碼審查 + 測試覆蓋 + 保安掃描 + PR 描述,4 個 agent 一齊跑 6-8 分鐘搞掂。教你點設定,同邊類任務適合並行。
- 創作者 · 45 分鐘
Claude Code 唔使開 terminal 都跑得:headless + cron 起夜貓自動化 workflow
Claude Code 唔淨係 interactive。Headless mode 可以入 cron、launchd、GitHub Actions、npm script,凌晨自動跑 code health、dep 審查、PR review。教 4 個真實設定 + 3 個部署變化。