← Trang chủ · Cài đặt · Kiến trúc · Agent đầu tiên · Google · Trình duyệt · Cron · Multi-Agent · Hồ sơ Agent · Model · Bộ nhớ · Vận hành
Lựa chọn Model
Chọn model phù hợp về chi phí, chất lượng, và độ tin cậy.
So sánh Giá (mỗi 1M token)
| Model | Provider | Input | Output | Context | Tool Calling | Phù hợp cho |
|---|---|---|---|---|---|---|
| Claude Haiku 4.5 | Anthropic | $1.00 | $5.00 | 200K | Xuất sắc | Baseline chất lượng |
| Claude Sonnet 4.5 | Anthropic | $3.00 | $15.00 | 200K | Xuất sắc | Suy luận phức tạp |
| Gemini 2.0 Flash | OpenRouter | $0.10 | $0.40 | 1M | Tốt | Khối lượng lớn, rẻ |
| Gemini 2.5 Flash | OpenRouter | $0.30 | $2.50 | 1M | Tốt | Context lớn |
| Kimi K2.5 | OpenRouter | $0.38 | $1.91 | 262K | Tốt | Tuân theo hướng dẫn |
| MiniMax M2.7 | OpenRouter | $0.30 | $1.20 | 204K | Tốt | Cân bằng chi phí/chất lượng |
| Qwen3 235B | OpenRouter | $0.07 | $0.10 | 262K | Khá | Siêu rẻ |
Khuyến nghị: Thống nhất M2.7 cho Tất cả Agent
Sau khi thử nhiều cấu hình, một model cho tất cả agent là đơn giản và tiết kiệm nhất:
"model": {
"primary": "openrouter/minimax/minimax-m2.7",
"fallbacks": [
"openrouter/google/gemini-2.0-flash-001",
"anthropic/claude-haiku-4-5"
]
}
Cả 3 agent (personal, research, kioku) dùng cùng chuỗi. M2.7 xử lý tốt tool calling, tiếng Việt, tuân theo SOUL.md cho mọi use case.
Tại sao không dùng model khác cho mỗi agent? Đã test Claude Haiku cho research, Ollama local cho digest — chất lượng tăng nhẹ không đáng đổi lại độ phức tạp. M2.7 ở mức $0.30/$1.20 mỗi 1M token là điểm cân bằng tốt nhất.
Model Local (Tùy chọn)
Cho vận hành offline/miễn phí, Ollama có thể làm primary:
"model": {
"primary": "ollama/qwen3:4b",
"fallbacks": ["openrouter/minimax/minimax-m2.7"]
}
Lưu ý: Model local chậm hơn 5-10 lần, có thể timeout với cron job phức tạp. Phù hợp cho chat đơn giản, không cho workflow nặng tool. Cần OLLAMA_API_KEY (giá trị bất kỳ) và brew services start ollama.
Thiết lập OpenRouter
Thêm API key vào ~/.openclaw/openclaw.json:
{
"env": {
"OPENROUTER_API_KEY": "sk-or-v1-KEY_CUA_BAN"
}
}
Model ID dùng tiền tố openrouter/: openrouter/minimax/minimax-m2.7
Ma trận Chất lượng Model
| Khả năng | Haiku 4.5 | M2.7 | Gemini Flash | Kimi K2.5 | Qwen3 |
|---|---|---|---|---|---|
| Tuân theo SOUL.md | ★★★★★ | ★★★★ | ★★★ | ★★★★ | ★★★ |
| Gọi tool | ★★★★★ | ★★★★ | ★★★★ | ★★★★ | ★★★ |
| Tiếng Việt | ★★★★★ | ★★★★ | ★★★ | ★★★ | ★★★★ |
| Tốc độ | Nhanh | Nhanh | Rất nhanh | Trung bình | Chậm |
| Độ tin cậy cron | ★★★★★ | ★★★ | ★★★★ | ★★★★ | ★★★ |
Vấn đề Đã Biết
Gemini 3 Flash: Lỗi Session
Sau ~50 lệnh tool trong cùng session: 400 function_response.name mismatch. Dùng Gemini 2.0 Flash cho session dài.
OpenRouter Timeout
Giờ cao điểm (UTC 0:00-06:00) có thể gây timeout. Biện pháp:
- Đặt
timeoutSeconds: 180(không phải 120) - Thêm Anthropic trực tiếp làm fallback cuối
- Cron job tự chạy lại lần lịch tiếp theo
M2.7 Chế độ Reasoning
M2.7 đôi khi trả về "content": null chỉ có reasoning token. OpenClaw có thể không parse đúng. Chuỗi fallback xử lý được.
Ước tính Chi phí
Cho vận hành hàng ngày điển hình:
| Cron Job | Lần/ngày | Token/lần | Model | Chi phí/ngày |
|---|---|---|---|---|
| Bản tin buổi sáng | 1 | ~25K | M2.7 | $0.04 |
| Phân loại email | 2 | ~25K | M2.7 | $0.07 |
| Chuẩn bị họp | 10 | ~5K (đa số: không có họp) | M2.7 | $0.02 |
| Tổng hợp Reddit | 1 | ~100K | M2.7 | $0.15 |
| Review tuần | 0.14 | ~50K | M2.7 | $0.01 |
| Chat tự do | ~10 | ~20K | M2.7 | $0.08 |
| Tổng cộng | ~$0.37/ngày ≈ $11/tháng |
So sánh: Cùng khối lượng công việc trên Haiku 4.5 ≈ $40/tháng.