Anthropic研究员Jackson Kernion发推称,他觉得Opus 4.5"已经接近AGI",甚至不确定接下来该把时间投入到什么方向上了。这条推文引发了不小的讨论,但评论区的反应相当冷静,甚至略带讽刺。核心质疑:这不就是营销吗?最高赞评论直接指出:他说"看到了某种东西",却没给出任何基准测试、定义或具体证据,纯粹是一种"感觉"。这更像是市场宣传而非技术判断。有人补充说:Anthropic明年即将IPO,这些研究员看到的可能不是AGI,而是自己股票期权变现的可能性。还有人调侃:在Anthropic工作的入职条件可能就是先经历一次"AI觉醒",然后开始"看到某些东西"。关于AGI定义本身的争论有人认为,AGI本来就是个模糊概念,没有统一标准,所以对某些人来说Opus 4.5"接近AGI"并非完全没道理。Dario Amodei曾在文章中定义过"powerful AI",但那和大众理解的AGI仍有差距。反对者指出:真正的AGI应该具备自主性、自我导向能力,而不是像现在这样需要用户指令才能运作。一个需要人类不断验证其输出的系统,怎么能叫AGI?也有人提出一个功能性定义:能完全取代人类工作者就是AGI,至于是否具备"自主意识"并不重要。但这又引出新问题——如果没有自我导向,怎么可能完全替代一个需要自主判断的人类员工?少数肯定的声音有用户表示,Opus 4.5确实在编程上表现惊人,对话体验也更自然流畅,少了其他模型常见的谄媚、居高临下或过度防御。如果Anthropic能补上图像、视频、音频等多模态能力,它可能是当前能达到的最佳形态。但也有人吐槽:今天Opus 4.5给我写了一个四行循环,结果直接把迭代器搞坏了。"感受一下这AGI的力量吧。"更深层的问题有人提到,如果五年前发布Opus 4.5,人们可能真的会称之为AGI。但今天的标准已经水涨船高。还有人说得更直接:与其发这种玄乎的推文,不如直接拿ARC、METR这些测试结果说话。等它真的通过了,我们再讨论。这场讨论的本质,其实是一个老问题的新版本:当一家公司的员工站出来为自家产品做情感化背书时,我们该相信多少?在资本、技术、叙事高度交织的AI领域,"我看到了某种东西"这种表达方式,可能恰恰说明——他们其实没有什么能说服所有人的东西。x.com/JacksonKernion/status/2004707761138053123
