AI 模型对比

最核心的 AI 模型自然是我们对比的首选。尽管各大编程 IDE 都涵括了几乎所有主流 AI 模型,但每家 AI 模型官方调教出的工具肯定是最合适和好用的。

截至 2026.7.1,主流 AI 模型对比如下:

  • Claude Opus 4.8:目前综合能力最强的代码生成模型,在长上下文推理、复杂重构、跨文件理解上仍然是断档水平。特别是对于 Unity、C++、Shader 这类工程链路复杂的场景,Opus 4.8 的规划能力和自查能力肉眼可见地领先,配合 1M 上下文窗口,几乎可以一次吃下一个中小型项目
  • GPT-5.5:OpenAI 在 2026 年上半年拿出的答卷,主打的是。它没有 Opus 那种一冲一个准的爆发力,但是对于经典算法、数学证明、系统设计这类需要长链推理的任务,GPT-5.5 有着极强的准确性,很多 Claude 反复犯错的地方它能一遍过,非常适合做 Code Review 和架构设计

Codex

Codex 是 OpenAI 在 2026 年的翻身之作,绑定 GPT-5.5,主打两点:审慎深度推理

它和 Claude Code 的差别很像 GPT-5.5 和 Claude Opus 4.8 的差别:

  • Claude Code 更像一个积极主动的高年级学生,收到需求就动手,速度快
  • Codex 更像一个老练的技术专家,动手前会想很多,改动前会反复确认,尤其在处理复杂的重构和架构类问题时特别可靠

我目前的使用方式是:大改动、跨模块重构先让 Codex 出方案,再让 Claude Code 落地实施。这样组合能拿到最好的 planner + executor 分工。

Codex 的另一个特色是他的Goal功能,虽然这种Loop能力很多厂商都推出了,但是Codex的Goal是我用的最舒服的,它在任务不偏离和成本之间做到了平衡。

Droid:王者中间件

强烈推荐 Droid。经过几个月的重度使用,其出色的提示词和工作流程调教,让它易用性甚至比 Cursor 时代还要好,而且还可以自定义 API Key,直接接 Opus 4.8 或 GPT-5.5。

Droid 的核心竞争力是它作为一个中间件存在:

  • 底层 AI 模型可以任意切换(Opus 4.8 / GPT-5.5 / Gemini 3.5 Pro / 自建模型),这意味着即使后面出现更强的 AI 模型,工作流程也不会受影响
  • 内置了 Skills、Sub Agent、Task Queue 等先进概念,一应俱全
  • 工具集比 Claude Code 更成熟一些,尤其在批量任务上
  • 对 Windows 支持相当扎实,这一点 Claude Code 早期版本一直被诟病

它解决了很多之前 Claude Code 无法察觉和处理的问题,速度也很快。日常我更倾向把 Droid 用在批量任务和跨仓库操作上,比如全项目 lint 修复、多个仓库的依赖升级同步、批量补充测试用例等等。

更远的未来:客户端的天下

Codex,Droid先后推出了可视化客户端,除了更美观之外,往往还都集成了操作电脑的能力,比如打开浏览器,点击网页,查看网页等,感觉应该是未来的一大趋势。

最佳实践指南

比较推荐的 MCP 有两个:

MCP 路由器

不同的项目可能会使用多个相同的 MCP,这时候就需要一个 MCP 路由器来帮我们管理所有 MCP,推荐:https://github.com/mcp-router/mcp-router

然后配置这个 MCP 路由器:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
{
"mcpServers": {
"mcp-router": {
"command": "npx",
"args": [
"-y",
"@mcp_router/cli@latest",
"connect"
],
"env": {
"MCPR_TOKEN": "mcpr_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
}
}
}
}

注意这里的 TOKEN 每个人不一样,需要自行在应用中获取并替换,具体步骤为:点击 Add Custom App,对新创建的条目点击 How To Use 即可。

使用心得

  • 对于代码重构相关的工作,尤其是接口更改类,最好先让 Codex + GPT-5.5 出方案,再让 Claude Code + Opus 4.8 落地。单模型硬冲复杂重构,即使是 Opus 4.8 也容易漏改
  • 对于 MCP、自定义规则,如果可以的话最好在输入的时候手动强调一下,不然 AI 有时真的会忽略
  • 遇到反复失败的任务,不要在同一个会话里死磕。开一个新会话,重新来过;或者切换到 Codex 跑一遍
  • 不要迷信一次生成,工程系统的稳定性不能押在模型每次临场发挥上。核心链路一定要用 Workflow 或 Skill 把关键步骤钉死,让模型只在允许的边界里发挥
  • Windows 平台优先选 Droid 或 Claude Code,Codex 在 Windows 下的路径处理仍然偶有小 bug
  • 2026年的今天,模型能力已经非常强了,就看工具层调教和记忆基建了

Claude Code官方直连推荐

中转站还是有挺多问题的,比如服务不稳定,隐私贩卖,我推荐 直接买官方直连的Claude Code,速度快,服务稳定! https://www.recode.cat/?aff=BTN9ZG3H

参考

Claude Code 官方文档
Codex 官方文档
Droid 官方文档