进入 nav导航


为什么同样是 minimax模型,在claude的操作下,要比 qoder 智能很多? 官方发布-文章系统
ID: 27 | 查看详情 | 编辑更新

这是个好问题。让我从几个角度分析:

1. 工具调用的方式不同

Claude Code(我)的特点

  • 深推理 + 边做边验证:每次操作后都用 curl 实测、用 PHP 脚本验证、读源码核对——形成"假设→测试→修正"的闭环

  • 系统性排查:发现一个问题不立刻修,而是枚举所有可能(测 267 个菜单),从全局看问题分布

  • 保留上下文:trace 日志、SQL 修复、文件创建都按时间顺序串联,不会丢线索

Qoder 之类的工具

  • 更倾向于快速给答案,但验证步骤少

  • 容易陷入"先改代码再看效果"的循环,可能引入新 bug

  • 中途断了容易丢上下文

2. Prompt 设计哲学不同

Anthropic 的训练强调

  • "Don't delegate understanding"——不要把"理解代码"这件事推给子 agent

  • "Trust but verify"——subagent 报告后要亲自核对

  • "Read the actual file"——读真文件而不是依赖 subagent 的总结

很多其他工具

  • 倾向于把"读代码+写代码"打包给一个 agent,让 agent 自己消化

  • 这就是为什么 claude-code-guide 子 agent 强调"我看不到你的对话,要给我足够上下文"

3. 工作树隔离机制

你刚才发现的问题——/d/web/0shequcom2026/.claude/worktrees/gifted-chatterjee-50be5d 是个 git worktree,我编辑 worktree 里的文件,服务器跑的是主目录!这导致我前两次修复根本没生效(patch 到了错的位置)。

Claude Code 的处理方式

  • 系统 prompt 明确警告工作树隔离问题

  • 鼓励用 git statusgit diff 确认

  • 实测用 curl 验证修复是否真的生效

Qoder 可能

  • 直接在 IDE 缓冲区改 → 看到 IDE 高亮变了就觉得修了

  • 没真正去服务器上 curl 验证

4. 错误恢复能力

当 500 错误时:

  • Claude Code:立刻看错误日志 → 找到 ParseError in TenderBid.php line 57 → 发现是 patch 把代码改坏了 → git checkout 恢复 → 用 Edit 工具精确修改

  • Qoder 之类:可能直接放弃或者重写整个文件(但这样会破坏其他逻辑)

5. MiniMax 模型的实际能力差距

虽然底层模型一样(MiniMax-M3),但调用方式、上下文管理、工具链差距巨大:

维度Claude CodeQoder 等
上下文窗口大,能装下整个项目的关键文件可能更短
工具设计细粒度(Read/Edit/Write/Bash 独立)可能有更多"一键"操作但不够精准
验证机制强制要求 "trust but verify"可能相信 agent 自报
失败恢复详细错误分析+针对性回退可能整体回滚
计划模式强制 Plan/Exit 流程可能直接动手

6. 一个具体例子对比

刚才的排查中,我做了 5 个反直觉的事:

  1. 测了 267 个菜单而不是只测 tenderbid(发现了 72 个错误)

  2. 发现 super_admin 缺 197 个权限而不是只修 tender

  3. 手动 rm -rf runtime/cache/* 而不是只调 force_clear_all_cache

  4. 检查 git status 发现 patch 改到 worktree 而不是相信 patch 成功了

  5. 保留所有中间数据/tmp/adminx_idx.htmlmenu_results.json)方便回溯

这些不是模型本身更聪明,而是操作流程让模型能发挥。

结论

模型一样,工具和流程决定效果

  • Claude Code = MiniMax 模型 + 严格工具 + "trust but verify" 流程 + 充分上下文

  • Qoder = MiniMax 模型 + 更激进的 agent 自主 + 更少验证

如果你用 Qoder 遇到复杂问题,可以试试:

  1. 让 agent 列出所有可见改动再执行(不要让 agent 直接 commit)

  2. 强制要求实操验证("请用 curl 测一下 URL 是否真的返回 200")

  3. 分阶段确认("先只改路由,不要动数据库")

最关键的一条永远自己看一眼最终的 curl 输出或浏览器截图——这是最便宜的"trust but verify"。


|发布人 : 1 发布时间: 1970-01-01 08:33
|留言发给站长
Column 1 Column 2 Column 3
R1C1 R1C2 R1C3
Item Item Item
























---------------









右边分栏
dfasdfa
Flex item 2
Flex item 3