Skip to content

Codex 怎么看 diff 和验证结果?小白验收清单

你会学到:Codex 改完之后,不靠“它说完成了”判断结果,而是用文件列表、diff、检查命令和人工阅读来验收。

先看结论

第一次用 Codex,验收只看 5 件事:

  1. 它改了哪些文件。
  2. 每个文件是不是你允许它改的。
  3. diff 里新增、删除、重写的内容是否能看懂。
  4. 有没有出现密钥、账号、私密路径、虚假安装命令或你没授权的配置。
  5. 是否通过了对应检查:文档靠人工读,代码靠测试、构建或运行结果。

如果这 5 件事说不清楚,就不要继续扩大任务范围。

diff 是什么

diff 就是文件改动前后的差异。

你可以把它理解成一张“修改账单”:

你看到的东西说明什么要怎么判断
新增行Codex 加了内容是否属于任务范围
删除行Codex 删了内容是否有充分理由
修改行Codex 改写了原文或代码是否改变了意思或行为
文件列表本次涉及哪些文件是否只改了允许范围

新手不要急着追求看懂所有代码。第一步只要先能判断“它有没有乱改范围”。

第一步:先看文件列表

Codex 结束任务后,先不要看它的总结,先看实际文件列表。

你要问自己:

  • 它是否只改了我允许修改的文件。
  • 有没有新增陌生文件。
  • 有没有改 .env、配置、脚本、依赖锁文件。
  • 有没有碰到我没有提到的目录。

如果你的任务是“只改 README”,那文件列表里就只能出现 README。只要出现代码、配置或依赖文件,就应该停下来。

第二步:逐段看 diff

看 diff 时,不要被大段文字吓住。按这个顺序读:

  1. 先看标题、段落、表格这些结构有没有被大幅改写。
  2. 再看新增内容有没有事实错误。
  3. 再看删除内容是不是你同意删除的。
  4. 最后看有没有多出来的命令、链接、账号要求或价格说明。

对新手来说,最危险的不是错别字,而是 Codex 编造了你没验证过的事实。

例如这些内容必须谨慎:

  • 安装命令。
  • 模型名称。
  • 价格、额度、计划权益。
  • 账号、地区、网络可用性。
  • 第三方下载链接。
  • 会删除文件或改配置的命令。

遇到这些内容,要回到官方页面或你能验证的来源再确认。

第三步:按任务类型验证

不同任务的验证方式不一样。

任务类型最小验证方式新手完成标准
README 或文档自己读一遍关键段落读得懂,没有假链接和假命令
项目总结对照目录和文件没有把不存在的文件写进去
配置解释对照原配置没有要求你复制不懂的命令
代码小改跑相关测试或构建命令通过,失败原因能解释
UI 改动打开页面看实际效果没有遮挡、错位、文字溢出

如果你不知道该跑什么检查,就先让 Codex 只解释验证方案,不要继续改文件。

可以这样问:

text
先不要继续修改文件。
请根据这次 diff,列出我应该人工检查的 5 个点。
如果需要运行命令,请说明每个命令的作用和风险。

第四步:让 Codex 解释 diff,但不要只信解释

Codex 可以帮你解释 diff,但它的解释不是证据。证据仍然是实际改动和实际检查结果。

你可以要求它按这个格式总结:

text
请按下面格式总结这次改动:
1. 修改了哪些文件。
2. 每个文件为什么要改。
3. 哪些地方需要我人工确认。
4. 做了哪些验证。
5. 还有什么风险。

如果它的总结和实际 diff 对不上,以 diff 为准。

第五步:决定接受、重改或撤回

验收后只有三种结果:

结果什么时候用下一步
接受范围正确,内容能读懂,检查通过记录验证方式,进入下一步
重改方向对,但有小问题明确指出哪几行要改
撤回改了未授权文件、事实错误严重、你看不懂丢弃改动,重新把任务变小

不要在“看不懂”的状态下继续追加要求。任务越叠越多,越难判断哪里出了问题。

小白默认规则 你可以不懂所有代码,但必须知道 Codex 改了哪些文件、为什么改、怎么验证、不满意怎么撤回。

常见错误

错误做法风险更好的做法
只看 Codex 总结可能漏掉实际改动先看文件列表和 diff
不看删除内容重要信息可能被删每个删除块都要读
看到测试失败还继续错误会叠加先解释失败原因
看不懂命令也运行可能改环境或删文件先问命令作用和风险
一次验收太多文件新手看不完把任务拆小

完成标准

读完这一页,你应该能做到:

  • 先看文件列表,再看 diff。
  • 判断 Codex 是否改了未授权文件。
  • 区分“Codex 的解释”和“实际证据”。
  • 知道文档、代码、UI 任务分别怎么做最小验证。
  • 在看不懂时选择暂停、重改或撤回。

推荐下一步

来源与复核

非 OpenAI 官方站。账号、下载、价格、额度和入口名称以官方页面为准。