多 Agent 协作
多个 AI 工具协同工作:Claude Code + Codex 组合策略
场景越复杂,单一工具越容易暴露短板。多 Agent 不是炫技,是应对真实项目复杂度的务实策略。
为什么需要多 Agent
没有万能工具。每个 AI 编程工具的设计理念、上下文窗口、模型偏好各不相同。我试过很长时间只用一个工具,结果是在某些任务上效率奇低——比如用 Cursor 做跨文件重构,或者用 Codex 做架构规划。
我现在的判断是:组合使用三个工具,可以覆盖 90% 的编程场景。这不是工具收集癖,而是让每个工具做它最擅长的事。
推荐组合
| 工具 | 角色 | 最适合 |
|---|---|---|
| Claude Code | 规划 + 架构 | 多文件重构、架构设计、复杂功能开发 |
| Codex CLI | 执行 + 诊断 | 深度 Bug 修复、代码审查、性能优化 |
| Gemini CLI | 前端探索 | 页面开发、视觉稿转代码、多模态任务 |
这三个工具各有侧重,组合使用形成完整的工作闭环。
Claude Code 做规划
Claude Code 的 Plan 模式是我常用的起点。在改任何复杂代码之前,先用 Plan 模式分析项目结构、梳理依赖关系、确定改动范围。
claude -p "分析当前项目的支付模块,列出需要改动的文件和依赖关系"规划输出后,人工 review 一遍再开始执行。这一步能省掉大量来回修改的时间。
Codex 做执行
规划确定后,Codex 的执行效率很高。它搭载 GPT-5.5,代码生成精度在目前所有工具中是最高的。遇到复杂 bug 时,Codex 的深度分析能力也明显强于其他工具。
Gemini CLI 做前端
前端页面开发(尤其是视觉探索阶段)我倾向于用 Gemini CLI。它的上下文窗口大,多模态能力强,适合从设计稿到代码的转换。如果项目以 React/Next.js 为主,Gemini CLI 的前端代码质量也不错。
任务拆分策略
多 Agent 工作流的核心不是用哪个工具,而是怎么拆任务。
按复杂度拆分
简单任务用便宜模型,复杂任务用顶级模型。日常编程中大约 70% 的任务是简单的——修个小 bug、改个样式、加个表单校验。这些用 DeepSeek V4 Flash 就能搞定,成本极低。
剩下 30% 的复杂任务——架构调整、多文件重构、性能优化——才需要用 Claude Opus 或 GPT-5.5。
按类型拆分
- 架构类任务 → Claude Code(跨文件理解最强)
- 诊断类任务 → Codex CLI(深度分析最强)
- 前端类任务 → Gemini CLI(多模态和上下文最强)
按阶段拆分
同一个功能,不同阶段用不同工具:
- 规划阶段:Claude Code Plan 模式,输出改动方案
- 执行阶段:Codex CLI,按照方案生成代码
- 审查阶段:人工 review + 自动化测试
实战经验
不要把切换工具本身搞复杂。我的做法是终端里同时开着几个工具,按任务类型直接切换。搭配 CC Switch 管理 API 配置,两三个命令就能切过去。
质量控制
多 Agent 协作最怕各改各的,最后合并时冲突不断。几个实践建议:
git 分支隔离
每个 Agent 的工作在独立分支上进行。规划分支产出方案文档,执行分支产出代码实现,最后人工合并到主分支。
git checkout -b feat/payment-planning # Claude Code 规划
git checkout -b feat/payment-coding # Codex 执行人工 review 不可省
AI 生成的代码必须经过人工 review。不是不信任 AI,而是 AI 不理解你的业务上下文和长期维护意图。每轮 Agent 完成后,用 git diff 看看改了什么,确认没有副作用。
测试前置
在让 Agent 改动之前,先确保测试能跑通。改动后让 Agent 自己运行测试,确认没有破坏既有功能。这一步可以用 CI 自动执行,但本地手动跑一遍也不费事。
实战案例:用 Claude Code + Codex 完成支付模块
下面是一个真实的工作流示例。假设要在项目中新增支付宝支付功能。
第一步:Claude Code 规划
claude -p "分析项目现有的支付体系,设计支付宝支付的实现方案,列出需要改动的文件和接口"Claude Code 输出方案文档,包含:
- 需要修改的文件列表(
src/db/schema、支付路由、前端页面) - 数据库表变更
- API 接口设计
- 前后端交互流程
我 review 方案,确认无误后合并到主分支。
第二步:Codex 执行
切换到独立分支,用 Codex 执行具体编码:
codex "根据这个方案实现支付宝支付:<粘贴方案要点>"Codex 依次完成数据库模型变更、后端 API 实现、前端页面调整。每次改完一个文件都会自动检查语法错误。
第三步:人工验收
- 运行
git diff检查所有改动 - 运行测试套件确认无回归
- 本地跑一遍完整支付流程
- 合并到主分支
整个流程下来,一个支付功能从规划到上线大约需要 2-3 小时,其中人工参与时间不到 1 小时。
我的建议
多 Agent 工作流不是一开始就要用的。如果你刚接触 AI 编程,先用一个工具做到顺手,遇到瓶颈了再引入第二个。过早堆工具反而增加认知负担。
当你已经熟悉单个工具后,可以按这个顺序扩展:
- 先加 Claude Code 做规划(如果你主用 Codex)
- 再加 Codex 做执行(如果你主用 Claude Code)
- 有前端需求再加 Gemini CLI
保持工具链轻量,核心是让 AI 帮你干活,不是在选工具上内耗。
下一步
- 阅读 Claude Code 完整教程 了解规划能力
- 查看 Codex 进阶技巧 提升执行效率
- 对比各工具差异:AI 编程工具推荐