DeepSeek刚发了两个新模型！DeepSeek同时发布2款新模型 DeepS

DeepSeek刚发了两个新模型！DeepSeek同时发布2款新模型 DeepSeek-V3.2 是该系列中兼顾高性能与部署成本的旗舰全能模型。它继承了 DeepSeek-V3.2-Exp 验证过的架构，也就是 DeepSeek Sparse Attention (DSA) 机制，在保持长上下文处理能力的同时显著降低了计算复杂度。该模型采用“混合强化学习（Mixed RL）”策略，将推理、智能体和人类对齐任务统一训练，并利用大规模合成的智能体任务数据（Synthetic Agentic Tasks）极大增强了工具使用能力。它优化了“工具调用中的思考（Thinking in Tool-Use）”机制，避免了像 DeepSeek-R1 那样在每轮交互中丢弃推理上下文的低效问题，从而在拥有比肩 GPT-5-High 综合性能的同时，实现了更优的 Token 效率。DeepSeek-V3.2-Speciale 则是为了探索开源模型智能上限而打造的高算力推理专用版。与标准版不同，它在强化学习阶段仅使用推理数据，并专门集成了 DeepSeek-Math-V2 的高难度数学证明数据集与奖励机制，以此强化复杂逻辑处理能力。为了换取极致的准确率，该模型放宽了生成长度限制（Length Constraints），允许模型进行极长思维链的“扩展思考” 。这一策略使其在 2025 年的 IMO（数学奥赛）和 IOI（信息学奥赛）中均斩获金牌表现，成功超越 GPT-5 并在推理能力上与目前最强的闭源模型 Gemini-3.0-Pro 分庭抗礼。科技先锋官

群发资讯网

DeepSeek刚发了两个新模型！DeepSeek同时发布2款新模型 DeepS

热门分类