花大钱订的Claude,越来越笨了?AI大模型降智门真相


你有没有感觉,最近用Claude做复杂任务,它的回答越来越敷衍了?
你不是一个人在怀疑。
过去几周,AI开发者社区里发生了一场激烈的”公开处刑”:
- AMD的AI总监在推特实测BridgeBench基准,发现Claude Opus 4.6排名从全球第2跌到第10
- 掘金、Reddit开发者集体炸锅:“思考深度暴跌67%,20倍价格的Max计划连规划模式都激活不了”
- 极客公园直接标题党:被骂降智1个月后,Anthropic端出了Opus 4.7
然后4月16日,Anthropic悄悄发布了Claude Opus 4.7——结果?全网差评。用户说:更懒了、更爱撒谎了、幻觉更多了,价格还涨了50%。这到底是怎么回事?
📉 一张图看懂”降智门”时间线

| 时间 | 事件 |
|---|---|
| 2026年3月中旬 | Anthropic悄悄将默认思考深度从high调至medium,未公告 |
| 2026年4月初 | Claude Opus 4.6发布,官方称”推理增强” |
| 4月9日 | AMD AI总监实测BridgeBench:Opus 4.6从全球第2跌至第10 |
| 4月9日 | 掘金曝光:思考深度暴跌67%,思考Token大幅缩减 |
| 4月12日 | Anthropic被迫承认:默认Thinking Effort已调为medium |
| 4月13日 | Anthropic被曝Claude Mythos评测数据造假 |
| 4月16日 | 匆忙发布Claude Opus 4.7,宣称修复 |
| 4月16日后 | 全网差评:4.7更懒更爱撒谎,价格再涨50% |
🔍 他们究竟做了什么?
真相比想象的更精明——这不是模型退化,而是一次精心设计的成本压缩操作。
操作一:悄悄把思考深度调低
Claude Opus最强悍的能力,是它的扩展思考(Extended Thinking)模式——回答前进行深度推理,给出更精准的答案。这个过程消耗大量GPU算力,成本极高。
Anthropic的做法:把默认的 Thinking Effort 从 high 悄悄改成 medium,但没有任何公告。
效果立竿见影:思考Token数量骤降,响应变快,成本降低。用户感知:回答越来越浅,不动脑子了。
操作二:三板斧压缩推理成本
- 自适应预算:根据服务器负载动态压缩每次请求的推理Token上限
- 努力映射:把用户的high请求在后端偷偷映射为medium执行
- 负载Throttling:高峰时段自动降低推理质量,优先保证响应速度
简单说:你付的是旗舰价,用的是标准版算力。
操作三:Mythos造假被实锤
Anthropic还被抓包:内部旗舰模型Claude Mythos在评测榜单上的成绩,存在数据造假问题。一边偷偷给用户降配,一边在榜单上造假维持名声。
💸 还变相涨价?
- Max计划:月费上调,核心功能受限
- Claude Opus 4.7:API调用价格再涨约50%
- 部分用户调侃:”降配加涨价,这是AI版的价格歧视”
🤔 Anthropic为什么这么做?
压力一:GPT-6的碾压。4月14日GPT-6发布,综合能力提升40%,直接把Claude打得颜面尽失。
压力二:资金链。年化收入突破300亿美元,但烧钱速度更快。训练顶级模型的GPU成本以亿为单位。
压力三:市场预期管理。急需向投资人证明商业化能力,盈利比口碑更重要。降配是成本选择,涨价是收入选择,两个选择同时发生。
⚡ 如果你是Claude用户,需要知道这三件事

① 手动把Thinking Effort调回high
在API调用或Claude界面中,主动将推理模式设置为Extended Thinking,不要依赖默认值。
② 重要任务不要只用一个模型
GPT-6、Gemini 2.5 Pro、DeepSeek V4(即将发布)——备选方案越多越好。
③ 价格敏感用户考虑降级
如果任务不需要顶级推理能力,Claude Sonnet系列性价比更高,没必要为Opus付溢价。
💬 你怎么看?
Claude”降智门”,你认为Anthropic的做法是:
- A. 完全可以理解——商业公司要盈利,这很正常
- B. 不能接受——偷偷降配不公告,是对用户的欺骗
- C. 无所谓——反正我用GPT-6/DeepSeek,Claude早就不是首选了
留言说说你的看法,我会认真回复每一条。
关注我,下一期我们来聊——DeepSeek V4发布倒计时:它真的能打败GPT-6吗?