Token Plan — quota live status
Đây là dữ liệu live từ api.minimax.io/v1/token_plan/remains tại 2026-04-26. Sếp đang trả tiền cho cả gói nhưng chỉ dùng 1 model. Các quota tô vàng = chưa khai thác.
Insight: Sếp trả tiền cho ít nhất 5 quota lớn nhưng chỉ tận dụng 1. Nếu mở full-power → 11 sub-agent có thể consume parallel ~163,000 requests/tuần thay vì 45,000. Đây là core value proposition của design này.
Harness Engineering — 10 yếu tố cốt lõi
"Harness" = bộ khung infrastructure để build AI agent system. Khác với "11-agent" (là policy, một cách dùng cụ thể). Hai tầng khác nhau, không thay thế lẫn nhau.
Tools agent có thể call: Read, Write, Bash, Glob, Grep, WebFetch... Quyết định khả năng vật lý.
Persist state across turn/session. Memory file của Sếp ở ~/.claude/projects/.../memory/.
Quyết định model nào xử task nào. Hiện tại: Opus vs M2.7. Đề xuất: + vlm + search + image-01.
Spawn parallel/sequential agents qua Agent tool. Sub-agent kế thừa model parent.
Modular capability packages (158+ skills). Auto-load via SKILL.md. Sếp có cook, fix, debug...
Allow/deny tool calls. Cấu hình trong settings.json. Guardrail an toàn.
CLAUDE.md auto-load + system reminders + memory injection. Quyết định agent biết gì.
Automated triggers (pre-tool, post-tool, stop). Cách thực thi "mỗi khi X thì Y".
TaskCreate/Update tracking + plan.md với YAML frontmatter (status, dependencies).
Files output: reports, llms.txt, mockup.html. Đây là nơi /ck:llms sống.
| Khía cạnh | Harness Engineering | 11 Sub-Agent Workflow |
|---|---|---|
| Bản chất | Infrastructure — bộ khung | Policy — 1 cách config |
| Phạm vi | Áp dụng mọi workflow | 5-phase dev workflow cụ thể |
| Thay đổi tần suất | Hiếm (kiến trúc nền) | Thường xuyên (theo nhu cầu) |
| Quan hệ | 11-agent là MỘT INSTANCE chạy trên harness. Sếp đổi 11 → 15 agent vẫn dùng cùng harness. | |
11 Sub-Agent — vai trò & routing hiện tại
Workflow 5-phase của Nelson. Routing hiện tại (v2.0) chỉ chia 2 nhóm: Opus (judgment) vs M2.7 (mechanical). Đề xuất mới: phân hoá xuống 5 model trong Token Plan.
| # | Phase | Sub-agent | Vai trò | Routing hiện tại | Routing đề xuất |
|---|---|---|---|---|---|
| 1 | Design | design-finder | Tìm UI inspiration từ Dribbble/Awwwards | Opus | vlm + search |
| 2 | Review | ux-reviewer | WCAG, responsive, screenshot analysis | Opus | vlm (đọc UI screenshot) |
| 3 | Review | code-reviewer | Logic, TypeScript, security surface | Opus | M2.7 (+ Opus final gate optional) |
| 4 | Review | security-auditor | OWASP Top 10, secrets, auth | Opus | M2.7 + Opus 2-pass |
| 5 | Review | perf-analyzer | Bundle size, N+1, Core Web Vitals | Opus | M2.7 + search |
| 6 | Execute | master-executor | Apply fixes từ review reports | M2.7 | M2.7 (giữ nguyên) |
| 7 | Process | test-writer | Unit/integration/e2e test gen | M2.7 | M2.7 (giữ nguyên) |
| 8 | Process | doc-writer | JSDoc, README, API docs | M2.7 | M2.7 + image-01 (diagrams) |
| 9 | Process | tech-debt-tracker | TODO/FIXME scan, register | Opus | M2.7 |
| 10 | Finalize | git-commit | Conventional commit message | M2.7 | M2.7 (giữ nguyên) |
| 11 | — | i18n-checker | Translation key audit | N/A | Không dùng (Email = English only) |
Quota → Sub-agent allocation matrix
Mapping cụ thể từng quota Token Plan với sub-agent phù hợp. Đây là cách "nạp full power" cho 11 agent.
45,000 req/tuần · chưa dùng 1 request
Phục vụ:
- ux-reviewer — đọc screenshot UI, check spacing, hierarchy
- design-finder — analyze inspiration images từ Dribbble
- doc-writer — đọc diagram screenshot, sinh ra docs giải thích
- ERP review — đọc screenshot ribbon, Quote sheet, đề xuất layout fix
45,000 req/tuần · chưa dùng 1 request
Phục vụ:
- perf-analyzer — lookup latest best-practice từ Vercel/web.dev
- tech-debt-tracker — search known antipatterns
- design-finder — search Awwwards + freight industry sites
- backend research — latest FastAPI/Pandas/DuckDB patterns
350 req/tuần · chưa dùng 1 request
Phục vụ:
- design-finder — sinh UI mockup nhanh (alt cho Gemini Nano Banana)
- doc-writer — diagram architecture, flowchart
- email pipeline — generate header banner cho weekly blast
28,000 req/tuần · chưa dùng 1 request
Phục vụ (offline, không phải sub-agent):
- Voice daily report — biến tech-debt report thành audio để Sếp nghe khi lái xe
- Email campaign QA — TTS đọc draft trước khi gửi để check tone
- Onboarding 6 mentees Life OS — voice walkthrough
44,434 req/tuần còn lại · 566 đã dùng
Default cho mọi task không match 4 model trên: master-executor, test-writer, code-reviewer, security-auditor (1st pass), git-commit, tech-debt-tracker. Bao gồm cả ERP/Excel COM/email pipeline (safety override LIFTED theo approval Sếp 2026-04-26).
/ck:llms auto-snapshot flow
Sau mỗi plan execution, Opus auto-sinh 1 file llms.txt nén toàn bộ context hệ thống thành ≤5K tokens. MiniMax đọc 1 file = hiểu trọn bộ system, thay vì grep nhiều file (đốt token).
Lưu ý: Hook chạy bất đồng bộ với Claude. Không block conversation. Fail-soft: nếu skill error, log warning thay vì crash.
Implementation roadmap (3 sprints)
Em chia 3 phase nhỏ để giảm risk. Mỗi phase có exit criteria cụ thể, có thể rollback nếu fail.
Effort: 1 ngày
- Tạo wrapper script
mm-vlm.sh,mm-search.shbên cạnhmm-claude.sh - Update
ck:workflowv2.1: route ux-reviewer→vlm, perf-analyzer→search - Test end-to-end với 1 task pilot (đọc Quote sheet screenshot)
Exit: 1 successful vlm call + 1 search call, log @ mm-wf-runs.log
Effort: 2 ngày
- Build skill
.claude/skills/ck-llms/SKILL.md(extract + compress) - Build helper
~/.claude/bin/gen-llms.sh - Wire PostToolUse + Stop hooks trong
settings.json - Test: chạy 1 plan demo, verify llms.txt sinh đúng format llmstxt.org
Exit: M2.7 đọc llms.txt (1 read) → answer "where is rate predictor?" đúng, không grep
Effort: 2 ngày
- Lift ERP/VBA safety override (theo Sếp approve)
- Pilot test: M2.7 sửa 3 VBA function nhỏ, verify-erp.bat phải pass 7/7
- Benchmark Opus vs M2.7 trên 5 task: code review, security audit, test gen, doc write, perf analyze
- Update routing rule cuối cùng dựa trên data thực
Exit: Benchmark report HTML, decision matrix updated
Risk + mitigation
Em phải nói thẳng — thay đổi này tăng power nhưng cũng tăng risk. Mỗi risk có cách giảm thiểu.
verify-erp.bat sau mỗi VBA edit. Fail → auto-rollback git + escalate Opus.set +e, log to file thay vì stdout, exit 0 luôn. Fail-soft pattern.Approval checklist — Sếp tick để bắt đầu
Em cần Sếp confirm 5 điểm trước khi implement (em đã save vào memory feedback_minimax_full_power.md):