群发资讯网

DeepSeek新增快速与专家双模式,灰度测试多模态Vision功能

DeepSeek服务器崩了才舍得搞分层……
4月8日凌晨,DeepSeek在没有任何官方公告的情况下,于网页端及App全量上线“快速模式”和“专家模式”。两个图标出现在输入框上方——一个闪电,一个钻石。

快速模式标注“适合日常对话,即时响应”,支持识别图片和文件中的文字,背后大概率运行轻量版V4 Lite模型。专家模式标注“擅长复杂问题,高峰需等待”,目前不支持文件上传和多模态能力。网友实测发现,在物理仿真、数学推理等高难度任务中,专家模式表现明显优于快速模式;而在简单任务上两者差距不大。

这次升级来得并不突然。3月30日,DeepSeek经历了超10小时的C端服务崩溃,网页端和App无法使用,但API调用正常。过去60天内,这已是第二次大规模中断。业内分析指出,DeepSeek的C端推理集群可能只有几千张卡,算力资源远低于实际日活需求。此次分层设计正是用产品手段缓解基础设施压力——日常对话走快速模式的小模型,复杂任务才调用专家模式的大模型。

灰度测试用户界面还出现了第三个选项“视觉模式”。博主“Teortaxes”分析认为,将Vision单独列为一个类是不寻常的设计,可能不是常规VLM,而是某种“深度统一世界模型”。但也有网友逆向前端代码发现,所谓视觉模式可能只是在快速模式下加了一个参数。据“拟合论见”消息,DeepSeek短期内不会针对专家模式收费,网页端和App仍将完全免费。

据“路透社”和“晚点LatePost”报道,DeepSeek V4预计4月正式发布,将搭载华为昇腾最新芯片。DeepSeek与华为、寒武纪已合作数月,专门修改基础代码以确保与国产硬件兼容。为迎接V4发布,阿里巴巴、字节跳动、腾讯等已预订数十万片新一代AI算力芯片,相关产品价格近期上涨约20%。