《Shared sensitivity to data distribution

《Shared sensitivity to data distribution during learning in humans and transformer networks》人类与大模型的学习方式是否在本质上趋同？这不再仅仅是一个哲学命题，而是一场严谨的实验。研究者通过对530名人类受试者与小型Transformer网络进行相同的规则学习测试，揭示了生物智能与人工智能之间令人惊叹的共性与分野。实验的核心变量是训练数据的统计分布。当数据高度多样化时，人类和Transformer都能敏锐地捕捉到潜在规律，展现出强大的泛化能力，即在陌生情境下运用规则。而当数据高度重复时，两者都会转向死记硬背，将特定的例子刻进权重。这种行为的转变点在数学上高度一致。在齐普夫分布指数约为1的临界点，生物系统与人工系统表现出了几乎相同的敏感度。只有当数据分布兼具多样性与重复性时，两者才能进化为双重学习者，既掌握规则又记住细节。然而，真正的分水岭出现在学习的顺序上。人类是天生的课程学习者。如果我们先接触多样化的案例建立认知框架，随后再进行重复记忆，我们不仅能掌握规则，还不会丢失细节。相比之下，Transformer却面临灾难性干扰：新学到的模式往往会粗暴地覆盖掉先前的记忆。这意味着，学习的成效不仅取决于你学了什么，更取决于你以什么样的顺序去学。数据结构的重要性丝毫不亚于数据内容本身。人类的优势在于那种能在动态序列中保持认知稳定的韧性，而这正是目前AI所缺失的灵活性。深度学习的未来或许不在于堆砌更多的数据，而在于模拟人类的记忆整合机制。真正的智能不仅是记住一切，更是学会在摄取新知的同时，有选择地保留那些具有普适价值的规则。www.nature.com/articles/s41562-025-02359-3

群发资讯网

《Shared sensitivity to data distribution

热门分类