我的好朋友 Claude
Claude Code 揀啱 model 慳 70% 成本:Haiku 跑雜務、Sonnet 出 feature、Opus 做架構
第 123 期

Claude Code 揀啱 model 慳 70% 成本:Haiku 跑雜務、Sonnet 出 feature、Opus 做架構

進深·科技
第 123 期|Claude Code|創作者、打工仔|

Claude Code 預設用 Sonnet,月底見單先嚇親。其實 80% 嘅工作(改名、搬檔、樣板碼)Haiku 已經夠用。教你按工作揀 model:雜務用 Haiku、feature 用 Sonnet、架構先出 Opus,月費直接落 70%。

難度 ★★時間 30 分鐘用具 Claude Code CLI、Anthropic API key
【編者撰】一個香港人

情境

你裝咗 Claude Code 兩個月,每日用,工作流順到唔捨得放低。

第一個月單出嚟:US$340。

你嚇親。攤開 usage dashboard 望真啲:

而呢三類工作,全部用緊同一個 model —— Sonnet 4.5。

呢個預設邏輯有問題:

呢篇教你建立「按工作揀 model」嘅做法。3 個 slash command、1 條 CLAUDE.md routing 規則、加 subagent 分派 —— 跟住做,下個月單落 50%-70%,質素冇跌反而升(因為複雜工作開始用 Opus)。

跟住做

1. 三隻 model 價錢對照 + 工作分類(5 分鐘)

先喺腦入面建立個概念。3 隻 model 嘅 input/output 價錢(每 1M tokens,2026 年 5 月報價):

ModelInputOutput適合
Haiku 4.5US$1US$5雜務、平行工作、樣板碼
Sonnet 4.5US$3US$15日常 feature 開發、code review
Opus 4.7US$15US$75架構、複雜 debug、長篇推理

Opus output 係 Haiku 嘅 15 倍。但你日常根本唔需要 Opus 級數嘅推理。

工作對應 model:

2. 整 /haiku /sonnet /opus slash command(10 分鐘)

喺 project root 整個 .claude/commands/ 資料夾:

mkdir -p .claude/commands

整三個 slash command 檔案。.claude/commands/haiku.md

---
description: Switch to Haiku 4.5 for grunt work
---

切去 Haiku 4.5。呢個 model 適合:rename、move、boilerplate、簡單 regex、generate test fixtures。

執行:`/model claude-haiku-4-5`

之後請用最直接方式完成 task,唔好過度解釋。

.claude/commands/sonnet.md

---
description: Switch to Sonnet 4.5 for feature dev
---

切去 Sonnet 4.5。呢個係日常 default:寫 component、debug、refactor 一個 module。

執行:`/model claude-sonnet-4-5`

.claude/commands/opus.md

---
description: Switch to Opus 4.7 for architecture / deep reasoning
---

切去 Opus 4.7。只用喺:architecture 決定、race condition、performance bottleneck、跨 module 規劃。

執行:`/model claude-opus-4-7`

之後用 extended thinking,思考多角度。

之後喺 Claude Code session 打 /haiku/sonnet/opus 就一秒切到。

3. CLAUDE.md routing 規則 + subagent 分派(10 分鐘)

喺 project root 嘅 CLAUDE.md 加一節:

## Model routing

Default:Sonnet 4.5。

升 / 降 model 嘅準則:
- Task 屬於 rename / move / boilerplate / format / 簡單 regex → 主動建議切 Haiku
- Task 涉及 architecture、race condition、跨 3+ files 嘅規劃 → 主動建議切 Opus
- 唔肯定 → 留喺 Sonnet

Subagent dispatch:
- 用 Task tool 分派 grunt sub-task 嗰陣,明確 spec `model: claude-haiku-4-5`
- 例如「rename 30 個 file 入面個 helper 名」、「regenerate 50 個 test fixture」 → 用 Haiku subagent 平行跑

之後你問 Claude「改晒呢個 service 入面所有 oldName」,Claude 會自己提:「呢個係雜務,建議 /haiku 切咗先做。」

Subagent 平行跑嘅例子(喺 prompt 入面寫):

完整 prompt
分派 5 個 Haiku subagent 平行做以下嘢:
將 [src/services] 入面嘅 oldHelper 改名做 newHelper
更新 [src/components] 入面嘅 import path
重新生成 [tests/fixtures] 入面嘅 test fixture
更新 [docs/] 入面嘅文件引用
更新 CHANGELOG 一條紀錄
每個 subagent 用 model: claude-haiku-4-5,跑完匯總。

Haiku 平行跑 5 條,總成本可能仲低過用 Sonnet 順序做一條。

4. 每月成本檢視儀式(5 分鐘)

每月 1 號做:

  1. console.anthropic.com → Usage
  2. 按 model 篩選睇分佈
  3. 健康比例:Haiku 50-60% / Sonnet 30-40% / Opus 5-10%
  4. 如果 Sonnet > 70% → 你啲雜務冇切 Haiku
  5. 如果 Opus > 20% → 你濫用 Opus,部分工作 Sonnet 已經做到

調整完,下個月再睇。3 個月之內,你會慢慢校準到最啱自己工作模式嘅分佈。

變化

變化 1:Solo dev 緊預算版

每月想壓喺 US$50 以下。預設反過嚟 —— 預設 Haiku,要升級先用 Sonnet。

CLAUDE.md

## Model routing (budget mode)

Default:Haiku 4.5。
只有以下情況 escalate Sonnet:
- 寫新 feature(>50 行 new code)
- Debug 一個你形容係「tricky」嘅 bug
- 我明確打 /sonnet

絕對唔好自動切 Opus。我要用就會打 /opus。

呢個模式:質素稍稍跌少少、月費可以壓喺 US$30-50 之間。Side project / 學習階段啱用。

變化 2:Agency 多客戶版

接 5-10 個客戶,要分開計成本。每個客戶一個資料夾 + 一個 CLAUDE.md。

每個資料夾嘅 .env.local

ANTHROPIC_API_KEY=sk-ant-...
ANTHROPIC_PROJECT_TAG=client-acme

Anthropic console 入面開「Projects」,每個客戶一個 project,分開計費。月底直接出 invoice 一條 line item。

Routing 規則按客戶嘅預算去調 —— 肯付錢嘅客戶容許用 Opus,慳得就慳嘅客戶預設 Haiku。

變化 3:學習版

你學緊新 framework / 新概念,唔係趕住交嘢。

策略反過嚟:

學習階段「貴 model 用嚟解釋」其實划算 —— 你慳返嘅係「Google 唔到答案嗰兩個鐘」。

拆解:點解 work,同邊度會仆街

跟到上面就已經用得。下面呢段係畀**想由「跑一次 demo 慳到」做到「跑足一年都信得過」**嘅人——初學者可以跳過,唔影響你跟住做。

成本優化最唔老實嘅地方係:慳得太狠,省返嘅錢分分鐘賠返落去 debug 度。揀錯 model 唔會即刻爆畀你睇,係靜悄悄出錯。呢套 routing 做法,實際會喺呢幾個位仆街,你要預咗:

1. Haiku 靜靜雞做錯,你又信咗佢 你叫 Haiku 改名、搬 file,佢九成做得啱。但 grunt work 入面藏住唔係 grunt 嘅嘢——例如某個 oldName 撞正字串、注解、外部 config,要判斷先改得啱。Haiku 唔會話你知佢估緊。

2. Subagent 平行跑,互相踩到對方隻腳 你派 5 個 Haiku subagent 平行改嘢,聽落好爽。但「改名」同「更新 import path」係有先後依賴嘅——A 未改完,B 已經去搵舊名,搵唔到。平行 ≠ 無序。

3. 切咗 model,但 context 已經污糟咗 你喺同一個 session 由 Opus 傾完架構,順手 /haiku 落去做嘢。Haiku 接手嗰陣,前面 Opus 嘅長篇推理仲喺 context 入面——你慳咗 per-token 價,但條 context 又長又貴,慳幅冇你想像中大。

4. 報價同 model 名會變,你寫死咗就過時 你篇 routing 規則寫死 claude-opus-4-7、寫死「Output 係 Haiku 15 倍」。但模型版本會 rev、報價會調、舊 model 會退役。寫死嘅嘢有日會靜靜變成錯。

5. 「慳到盡」嘅心魔,本身就係成本 最隱形嘅一個——你開始為咗慳幾蚊,喺切 model 上面花心神:呢個 task 算唔算 grunt?要唔要切?切完又後悔。呢啲決策疲勞,比你慳嗰幾蚊貴。

呢幾個位,就係「跑一次 demo 慳到」同「跑足一年都慳得又信得過」之間嘅距離。

一個心態

預設係畀唔識揀嘅人用嘅。識揀嘅人,每件工作都揀啱工具。

Claude Code 預設 Sonnet 唔係佢嘅錯 —— 係佢未識你嘅工作模式。你裝嘅第一日,佢冇辦法分得清「改名」同「架構」對你嘅難度差幾遠。

但兩個月之後,你應該識自己。應該知道:

按工作揀 model 嘅意義唔係慳錢 —— 慳錢只係順帶嘅好處。真正意義係:你開始當 AI 係工具,唔再當佢係萬能嘅 oracle。Haiku 處理雜務、Sonnet 出活、Opus 做要諗嘢嘅深度工作 —— 你個腦本身都係咁分工。

最後提醒:

下個鐘整 3 個 slash command + 改 CLAUDE.md。月底先睇單對比。

文中工具 · 連結

睇完想同 Claude 一齊行一次?

撳一撳,就將成段 tutor 指示(連埋成篇文嘅內容)抄入剪貼簿。 貼入 Claude.ai 或 Claude Desktop,佢會用廣東話帶你一步一步行, 每步問你填關鍵位,最後畀返一個專為你情況寫嘅 prompt 帶走。

下期預告 · 相關情境
訂閱本副刊

每週日早上,
一道新菜送到你 inbox。

一篇 use case、一個香港情境、一個跟得到嘅做法。 冇 sell course、冇話你「再唔學就會失業」。

訂閱通道執緊緊
newsletter service 仲未接通。想第一時間收到新文章——
直接 email 我哋寫一句「訂閱」就得。

Email 「訂閱」畀我