Skip to the content.

🇬🇧 English

← Trang chủ · Cài đặt · Kiến trúc · Agent đầu tiên · Google · Trình duyệt · Cron · Multi-Agent · Hồ sơ Agent · Model · Bộ nhớ · Vận hành

Lựa chọn Model

Chọn model phù hợp về chi phí, chất lượng, và độ tin cậy.

So sánh Giá (mỗi 1M token)

Model Provider Input Output Context Tool Calling Phù hợp cho
Claude Haiku 4.5 Anthropic $1.00 $5.00 200K Xuất sắc Baseline chất lượng
Claude Sonnet 4.5 Anthropic $3.00 $15.00 200K Xuất sắc Suy luận phức tạp
Gemini 2.0 Flash OpenRouter $0.10 $0.40 1M Tốt Khối lượng lớn, rẻ
Gemini 2.5 Flash OpenRouter $0.30 $2.50 1M Tốt Context lớn
Kimi K2.5 OpenRouter $0.38 $1.91 262K Tốt Tuân theo hướng dẫn
MiniMax M2.7 OpenRouter $0.30 $1.20 204K Tốt Cân bằng chi phí/chất lượng
Qwen3 235B OpenRouter $0.07 $0.10 262K Khá Siêu rẻ

Khuyến nghị: Thống nhất M2.7 cho Tất cả Agent

Sau khi thử nhiều cấu hình, một model cho tất cả agent là đơn giản và tiết kiệm nhất:

"model": {
  "primary": "openrouter/minimax/minimax-m2.7",
  "fallbacks": [
    "openrouter/google/gemini-2.0-flash-001",
    "anthropic/claude-haiku-4-5"
  ]
}

Cả 3 agent (personal, research, kioku) dùng cùng chuỗi. M2.7 xử lý tốt tool calling, tiếng Việt, tuân theo SOUL.md cho mọi use case.

Tại sao không dùng model khác cho mỗi agent? Đã test Claude Haiku cho research, Ollama local cho digest — chất lượng tăng nhẹ không đáng đổi lại độ phức tạp. M2.7 ở mức $0.30/$1.20 mỗi 1M token là điểm cân bằng tốt nhất.

Model Local (Tùy chọn)

Cho vận hành offline/miễn phí, Ollama có thể làm primary:

"model": {
  "primary": "ollama/qwen3:4b",
  "fallbacks": ["openrouter/minimax/minimax-m2.7"]
}

Lưu ý: Model local chậm hơn 5-10 lần, có thể timeout với cron job phức tạp. Phù hợp cho chat đơn giản, không cho workflow nặng tool. Cần OLLAMA_API_KEY (giá trị bất kỳ) và brew services start ollama.

Thiết lập OpenRouter

Thêm API key vào ~/.openclaw/openclaw.json:

{
  "env": {
    "OPENROUTER_API_KEY": "sk-or-v1-KEY_CUA_BAN"
  }
}

Model ID dùng tiền tố openrouter/: openrouter/minimax/minimax-m2.7

Ma trận Chất lượng Model

Khả năng Haiku 4.5 M2.7 Gemini Flash Kimi K2.5 Qwen3
Tuân theo SOUL.md ★★★★★ ★★★★ ★★★ ★★★★ ★★★
Gọi tool ★★★★★ ★★★★ ★★★★ ★★★★ ★★★
Tiếng Việt ★★★★★ ★★★★ ★★★ ★★★ ★★★★
Tốc độ Nhanh Nhanh Rất nhanh Trung bình Chậm
Độ tin cậy cron ★★★★★ ★★★ ★★★★ ★★★★ ★★★

Vấn đề Đã Biết

Gemini 3 Flash: Lỗi Session

Sau ~50 lệnh tool trong cùng session: 400 function_response.name mismatch. Dùng Gemini 2.0 Flash cho session dài.

OpenRouter Timeout

Giờ cao điểm (UTC 0:00-06:00) có thể gây timeout. Biện pháp:

M2.7 Chế độ Reasoning

M2.7 đôi khi trả về "content": null chỉ có reasoning token. OpenClaw có thể không parse đúng. Chuỗi fallback xử lý được.

Ước tính Chi phí

Cho vận hành hàng ngày điển hình:

Cron Job Lần/ngày Token/lần Model Chi phí/ngày
Bản tin buổi sáng 1 ~25K M2.7 $0.04
Phân loại email 2 ~25K M2.7 $0.07
Chuẩn bị họp 10 ~5K (đa số: không có họp) M2.7 $0.02
Tổng hợp Reddit 1 ~100K M2.7 $0.15
Review tuần 0.14 ~50K M2.7 $0.01
Chat tự do ~10 ~20K M2.7 $0.08
Tổng cộng       ~$0.37/ngày ≈ $11/tháng

So sánh: Cùng khối lượng công việc trên Haiku 4.5 ≈ $40/tháng.

Tiếp theo: Hệ thống Bộ nhớ →