一个外国程序员对中国 AI 的中肯评价,在 X 上火了。
来看下他的原帖大意:
我认为 GLM 5.2 是开源模型世界对前沿 AI 实验室的第一个真正的“哦,天哪”时刻。
不是因为它比 Opus 或 GPT 更好。
它没有。
而是因为,这是我第一次在不同的真实任务中使用一个公开的开源模型,却没有立刻感受到差距。
这是全新的。
我一直对开源模型持怀疑态度。大多数模型在演示中令人印象深刻,但在实际工作中却让人失望。基准测试不错。杂乱任务中很弱。
GLM 5.2 给我的感觉不是这样。
用了几个小时后,我诚实的反应是:
这是我见过的最接近 ChatGPT 时刻的东西,对于开源/公开模型来说。
经济性仍然不简单。适当的推理可能需要大约 8 个 Nvidia H200,购买大约 40 万美元,租用每月 2 万美元。
但与企业每月向封闭实验室支付数百万美元相比。
突然间,开源模型不再是业余爱好者的叙事。
它们成了 CFO 的谈话话题。
