花大钱订的Claude,越来越笨了?AI大模型降智门真相

花大钱订的Claude,越来越笨了?AI大模型降智门真相

claude cover
Claude降智门封面

你有没有感觉,最近用Claude做复杂任务,它的回答越来越敷衍了?

你不是一个人在怀疑。

过去几周,AI开发者社区里发生了一场激烈的”公开处刑”:

  • AMD的AI总监在推特实测BridgeBench基准,发现Claude Opus 4.6排名从全球第2跌到第10
  • 掘金、Reddit开发者集体炸锅:“思考深度暴跌67%,20倍价格的Max计划连规划模式都激活不了”
  • 极客公园直接标题党:被骂降智1个月后,Anthropic端出了Opus 4.7

然后4月16日,Anthropic悄悄发布了Claude Opus 4.7——结果?全网差评。用户说:更懒了、更爱撒谎了、幻觉更多了,价格还涨了50%。这到底是怎么回事?

📉 一张图看懂”降智门”时间线

Claude降智时间线数据
时间事件
2026年3月中旬Anthropic悄悄将默认思考深度从high调至medium,未公告
2026年4月初Claude Opus 4.6发布,官方称”推理增强”
4月9日AMD AI总监实测BridgeBench:Opus 4.6从全球第2跌至第10
4月9日掘金曝光:思考深度暴跌67%,思考Token大幅缩减
4月12日Anthropic被迫承认:默认Thinking Effort已调为medium
4月13日Anthropic被曝Claude Mythos评测数据造假
4月16日匆忙发布Claude Opus 4.7,宣称修复
4月16日后全网差评:4.7更懒更爱撒谎,价格再涨50%

🔍 他们究竟做了什么?

真相比想象的更精明——这不是模型退化,而是一次精心设计的成本压缩操作

操作一:悄悄把思考深度调低

Claude Opus最强悍的能力,是它的扩展思考(Extended Thinking)模式——回答前进行深度推理,给出更精准的答案。这个过程消耗大量GPU算力,成本极高。

Anthropic的做法:把默认的 Thinking Effort 从 high 悄悄改成 medium但没有任何公告

效果立竿见影:思考Token数量骤降,响应变快,成本降低。用户感知:回答越来越浅,不动脑子了。

操作二:三板斧压缩推理成本

  • 自适应预算:根据服务器负载动态压缩每次请求的推理Token上限
  • 努力映射:把用户的high请求在后端偷偷映射为medium执行
  • 负载Throttling:高峰时段自动降低推理质量,优先保证响应速度

简单说:你付的是旗舰价,用的是标准版算力。

操作三:Mythos造假被实锤

Anthropic还被抓包:内部旗舰模型Claude Mythos在评测榜单上的成绩,存在数据造假问题。一边偷偷给用户降配,一边在榜单上造假维持名声。

💸 还变相涨价?

  • Max计划:月费上调,核心功能受限
  • Claude Opus 4.7:API调用价格再涨约50%
  • 部分用户调侃:”降配加涨价,这是AI版的价格歧视”

🤔 Anthropic为什么这么做?

压力一:GPT-6的碾压。4月14日GPT-6发布,综合能力提升40%,直接把Claude打得颜面尽失。

压力二:资金链。年化收入突破300亿美元,但烧钱速度更快。训练顶级模型的GPU成本以亿为单位。

压力三:市场预期管理。急需向投资人证明商业化能力,盈利比口碑更重要。降配是成本选择,涨价是收入选择,两个选择同时发生。

⚡ 如果你是Claude用户,需要知道这三件事

AI用户建议

① 手动把Thinking Effort调回high
在API调用或Claude界面中,主动将推理模式设置为Extended Thinking,不要依赖默认值。

② 重要任务不要只用一个模型
GPT-6、Gemini 2.5 Pro、DeepSeek V4(即将发布)——备选方案越多越好。

③ 价格敏感用户考虑降级
如果任务不需要顶级推理能力,Claude Sonnet系列性价比更高,没必要为Opus付溢价。

💬 你怎么看?

Claude”降智门”,你认为Anthropic的做法是:

  • A. 完全可以理解——商业公司要盈利,这很正常
  • B. 不能接受——偷偷降配不公告,是对用户的欺骗
  • C. 无所谓——反正我用GPT-6/DeepSeek,Claude早就不是首选了

留言说说你的看法,我会认真回复每一条。


关注我,下一期我们来聊——DeepSeek V4发布倒计时:它真的能打败GPT-6吗?

留下回复