群发资讯网

DeepSeek v4 百万上下文今天DeepSeek官方正式发文,称DeepS

DeepSeek v4 百万上下文今天DeepSeek官方正式发文,称DeepSeek V4的预览版本正式上线并同步开源,DeepSeek V4拥有Pro与Flash两个版本模型,分别对应网页端/App上的“专家模式”与“快速模式”。

DeepSeek V4 Pro的参数达到1.6T,激活参数49B,预训练数据33T,上下文长度达到1M。Flash的参数达到284B,激活参数13B,预训练数据32T,上下文长度同样达到1M。

不过DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格还会大幅下调。DeepSeek V4的意义还是比较重大的,它意味着国产顶级开源大模型在推理环节已经摆脱对英伟达GPU的依赖。