我是搭配 GPT5 High 模型使用的,第一个执行的指令就能感觉出来比 Claude Code + Claude 4 Sonnet 效果更好,指令遵循性超级强,以前如果有复杂的功能需要提前设计方案我会使用 Gemini 2.5 Pro 先做方案,然后再让 Claude 实施,但是使用 codeX 我已经不需要再切出去用 Gemini 了,它的方案设计很完善,实施的时候也很稳定,除了输出速度比 Claude 慢很多,其他方面几乎没啥缺点,而且在编程的场景,很多时候慢就是快,一次稳定的输出胜过缝缝补补几个来回。上下文也比 Claude 长很多,而且每一次完成任务后,他会自己反思有哪些可以继续优化的点,然后通过带序号的分点展示出来,我们下一次对话只要简单输入序号就好了(可以看图二)。由于执行速度比较慢,我一般都会把 approval 改为 Full Access,相当于 Claude Code 的 --dangerously-skip-permissions 这样它就可以自己长时间的执行任务了。
我用 CodeX 实现了自己用的维护产品特性列表的小工具,使用 DND 实现拖拽排序的效果,全程没有什么返工的情况。而且在让它实现一些 AI 相关的功能的时候,它能够自己想是不是需要用流式输出, Prompt 要如何设计,是不是可以复用组件等,把很多我自己想要一步一步实现的功能提前想到了。在之前使用 Claude 的时候,由于幻觉问题,它经常把我明确说明的某个模型给修改,比如我说要用 GPT-5,它会认为 GPT-5 还没发布,偷偷改成 GPT-4o 了,而 CodeX 就不会这样,用了一周之后几乎不再想用 Claude 模型了。非常推荐!