Claude Opus 4.7 刷屏一晚上，200 条真实讨论扒完，老板真正该记住的就这几条

Opus 4.7 昨晚刚发，推特和 Reddit 吵了一宿。刷朋友圈的你大概看到两派：一派说”新一代神器”，一派说”被阉割的 4.6，还更贵”。老板问我到底能不能用到公司里。

我干脆把 X、Reddit、GitHub、HackerNews 上关于它的帖子全抓了一遍——程序员、订阅用户、把它接进产品结果踩坑的创业者，大概 200 条真实讨论——做成了一个网站：https://opus.sightx.top ，你能自己翻原帖。下面这篇，是我替你看完之后挑的几条结论。不吹，也不黑。

一、最大的变化：它终于”能自己干完活”了

过去你用 AI 做事，最累的不是它不会，是它每十几分钟就要打断你一次：这个要怎么处理？那个方案你选哪个？你得坐在旁边陪跑。

这一代不一样。Reddit 上有条高赞帖写得直白：”测试者说，可以把硬核编码任务丢给它，不用盯着。”Anthropic 自己官方给 Claude Code 加了个 /ultrareview 命令，像代码审查员一样扫一遍改动、自己标出问题。推特上有人用完之后说：”Opus 4.7 比 4.6 感觉更严肃、更专注、更有执行决心，我甚至得换种方式跟它说话。”

翻译成老板的语言：以前 AI 像个应届生，你得手把手带；现在它更像个能独立接活的外包——你交代清楚，去开会，回来它把东西做得差不多了。公司里那些固定流程活——整理数据、写报告、跨几个系统搬信息——它真能接住。

二、硬数据：电脑操作 86 分是什么概念

一个叫 OSWorld 的基准测试，让 AI 自己去操作电脑（点网页、填表单、在几个软件之间来回搬数据），得分越高越说明能替代白领重复工。Opus 4.7 裸模型 78 分，一个叫 Coasty 的 agent 跑到了 86 分。

这是什么概念？去年同类任务最好的模型大概在 60 分上下徘徊。86 分的意思是，”自动对账、自动填工单、自动从 CRM 导数据到 Excel 再发邮件”这种你以前必须招人做的事，第一次进入”真的可以交给机器”的门槛。

不是明天所有客服都丢饭碗，而是你之前觉得”招人太贵又太闲”的那类岗位，现在有了第三个选项。

三、贵，贵得老板得先想清楚

这一代最大的槽点就两个字：烧钱。

GitHub Copilot 里，Opus 4.7 的价格从 Opus 4.6 的 3 倍直接跳到 7.5 倍，翻了两倍半。有人在 Hacker News 上发帖：”Pro 20 美元套餐，15 分钟就打空了”；Reddit 上有 Max 100 美元套餐的用户哭诉：”一个简单的提词器 app 审一下，84% 的额度就没了，以前用 4.6 能撑好几个小时。”

API 价格是每百万输入 token 5 美元、输出 25 美元，和 4.6 同价，但它的新分词器会多烧 1 到 1.35 倍 token，算下来实际比 4.6 贵 50% 左右，比市面上多数商业模型贵一倍。

结论很清楚：这不是取代便宜模型的货，是取代高级工程师、中级员工的货。日常的”改个标点、写个周报”，用便宜模型干；只有那种你本来打算”招一个月薪 2 万的人来做”的活，才值得让 Opus 4.7 上。分活的能力，是 2026 年老板用 AI 的基本功。

四、两个必须知道的坑

第一个坑：长文档会失忆。 Anthropic 自己的模型卡承认，在 100 万 token 长度下，它的”记忆准确率”从 4.6 的 78% 直接掉到 32%，拦腰砍半。什么意思？你一次塞 500 页合同进去让它总结，结果它会漏掉中间关键条款还自信满满。别赌这个，长文档要拆。

第二个坑：安全限制管得太宽。 HN 上有一个做授权漏洞赏金的安全研究员发帖：”Opus 4.7 把所有网络安全工作流都拒了，连我把甲方授权书贴出来都没用。”GitHub 上一堆报错，很多原本合法的研究工作被直接封死。我自己做这篇文章的项目网站也是，它帮我写完 Reddit、GitHub、HN 的抓取脚本之后，到了抓推特这一步，它判定违规直接罢工，我只好把这最后一步换成另一个 AI 来收尾。

不是 Opus 不聪明，是它被教得过度谨慎。对企业用户来说，意味着合规敏感的活它能做，但你预期它每次都不挑活，是要失望的。

五、和其它 AI 比，它在哪块赢，在哪块输

和自家 Opus 4.6 比：编码能力涨了 13%，但长上下文倒退，价格涨 50%。有人干脆回滚：”Opus 4.7 就是个被阉割了、还多烧 token 的 4.6。”这种声音不小。

和 OpenAI 的 Codex / GPT-5.4 比：推特上有测试者说”Codex 赢了这场战争，4.7 像个蠢模型”，另一些人则用 GPT-5.4 打底，让 Opus 4.7 做”深挖一层”的活——一个负责范围，一个负责深度，这是目前比较成熟的组合用法。

和 Gemini 3 比：有人拿一个和弦识别同时问三家，Gemini 回答”C-E-G = C 大调”，GPT 猜成 Amin，Opus 4.7 直接说”信息不足，我判断不了”。保守，但诚实——这恰好是你让它接客户咨询时想要的性格。

六、对中小企业老板的三条实用建议

一、不要为了尝鲜全员切过去。 先选一个具体场景——写周报、做对账、回询盘——做 A/B 对比，让 4.7 和你现在用的模型各跑一周，算出真实每任务成本。帐算出来，再决定要不要铺开。

二、把活分三层。 反复做的琐事（改格式、列清单），用便宜模型或 Haiku；需要动脑但不敏感的（客服、报告、内部知识查询），用中档模型；需要它”独立做几小时不出错”的高价值活（代码、方案、复杂数据整理），才上 Opus 4.7。这是 7.5 倍价格的正确用法。

三、准备两套方案。 Opus 4.7 拒活的时候，你要有 Plan B——可能是别家模型，可能是让员工兜底。把它当一个”聪明但有原则”的外包，而不是”听话的实习生”。

最后

你今天看到的这 200 条真实讨论，是我花了一个晚上抓下来筛出来的。真相是：新模型刚发一天，网上 63% 的帖子是中立事务记录，25% 是实打实的槽点，只有 9% 是真吹。能看懂哪 9% 是风口、哪 25% 是坑的人，才能用 AI 省下一个中级员工的钱。

这件事不是”装个软件”那么简单。分活、控成本、挑场景、配 Plan B，每一条都有坑。我这一年帮中小企业老板把 AI 装进公司的流程里，一对一算账、定方案、跑起来。

你要是想把 Opus 4.7 或者同级的 AI 真装进你公司，而不是看别人吹一阵然后默默交学费，来找我：https://setclaw.cn 。我是大熊。

不是让你赶风口，是让你这一轮 AI 别又白花钱。