AI 模型对比

最核心的 AI 模型自然是我们对比的首选。尽管各大编程 IDE 都涵括了几乎所有主流 AI 模型，但每家 AI 模型官方调教出的工具肯定是最合适和好用的。

截至 2026.7.1，主流 AI 模型对比如下：

Claude Opus 4.8：目前综合能力最强的代码生成模型，在长上下文推理、复杂重构、跨文件理解上仍然是断档水平。特别是对于 Unity、C++、Shader 这类工程链路复杂的场景，Opus 4.8 的规划能力和自查能力肉眼可见地领先，配合 1M 上下文窗口，几乎可以一次吃下一个中小型项目
GPT-5.5：OpenAI 在 2026 年上半年拿出的答卷，主打的是稳。它没有 Opus 那种一冲一个准的爆发力，但是对于经典算法、数学证明、系统设计这类需要长链推理的任务，GPT-5.5 有着极强的准确性，很多 Claude 反复犯错的地方它能一遍过，非常适合做 Code Review 和架构设计

Codex

Codex 是 OpenAI 在 2026 年的翻身之作，绑定 GPT-5.5，主打两点：审慎和深度推理。

它和 Claude Code 的差别很像 GPT-5.5 和 Claude Opus 4.8 的差别：

Claude Code 更像一个积极主动的高年级学生，收到需求就动手，速度快
Codex 更像一个老练的技术专家，动手前会想很多，改动前会反复确认，尤其在处理复杂的重构和架构类问题时特别可靠

我目前的使用方式是：大改动、跨模块重构先让 Codex 出方案，再让 Claude Code 落地实施。这样组合能拿到最好的 planner + executor 分工。

Codex 的另一个特色是他的Goal功能，虽然这种Loop能力很多厂商都推出了，但是Codex的Goal是我用的最舒服的，它在任务不偏离和成本之间做到了平衡。

Droid：王者中间件

强烈推荐 Droid。经过几个月的重度使用，其出色的提示词和工作流程调教，让它易用性甚至比 Cursor 时代还要好，而且还可以自定义 API Key，直接接 Opus 4.8 或 GPT-5.5。

Droid 的核心竞争力是它作为一个中间件存在：

底层 AI 模型可以任意切换（Opus 4.8 / GPT-5.5 / Gemini 3.5 Pro / 自建模型），这意味着即使后面出现更强的 AI 模型，工作流程也不会受影响
内置了 Skills、Sub Agent、Task Queue 等先进概念，一应俱全
工具集比 Claude Code 更成熟一些，尤其在批量任务上
对 Windows 支持相当扎实，这一点 Claude Code 早期版本一直被诟病

它解决了很多之前 Claude Code 无法察觉和处理的问题，速度也很快。日常我更倾向把 Droid 用在批量任务和跨仓库操作上，比如全项目 lint 修复、多个仓库的依赖升级同步、批量补充测试用例等等。

更远的未来：客户端的天下

Codex，Droid先后推出了可视化客户端，除了更美观之外，往往还都集成了操作电脑的能力，比如打开浏览器，点击网页，查看网页等，感觉应该是未来的一大趋势。

最佳实践指南

比较推荐的 MCP 有两个：

https://github.com/upstash/context7 实时获取第三方库最新的文档
https://github.com/wqaetly/memos-api-mcp/tree/cloud 基于 https://memos.openmem.net/cn/ 的MCP工具，它可以自动记忆并检索，大大提高对话之间的连续性，而且完全免费，强烈推荐！

MCP 路由器

不同的项目可能会使用多个相同的 MCP，这时候就需要一个 MCP 路由器来帮我们管理所有 MCP，推荐：https://github.com/mcp-router/mcp-router

然后配置这个 MCP 路由器：

{
  "mcpServers": {
    "mcp-router": {
      "command": "npx",
      "args": [
        "-y",
        "@mcp_router/cli@latest",
        "connect"
      ],
      "env": {
        "MCPR_TOKEN": "mcpr_xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
      }
    }
  }
}

注意这里的 TOKEN 每个人不一样，需要自行在应用中获取并替换，具体步骤为：点击 Add Custom App，对新创建的条目点击 How To Use 即可。

使用心得

对于代码重构相关的工作，尤其是接口更改类，最好先让 Codex + GPT-5.5 出方案，再让 Claude Code + Opus 4.8 落地。单模型硬冲复杂重构，即使是 Opus 4.8 也容易漏改
对于 MCP、自定义规则，如果可以的话最好在输入的时候手动强调一下，不然 AI 有时真的会忽略
遇到反复失败的任务，不要在同一个会话里死磕。开一个新会话，重新来过；或者切换到 Codex 跑一遍
不要迷信一次生成，工程系统的稳定性不能押在模型每次临场发挥上。核心链路一定要用 Workflow 或 Skill 把关键步骤钉死，让模型只在允许的边界里发挥
Windows 平台优先选 Droid 或 Claude Code，Codex 在 Windows 下的路径处理仍然偶有小 bug
2026年的今天，模型能力已经非常强了，就看工具层调教和记忆基建了