V4有哪些特点和优势 DeepSeek V4亮点超多!它全系标配百万级上下文,能处理像《三体》三部曲那么长的文本,实现“长文本普惠”。V4 - Pro总参数达1.6万亿,刷新开源模型参数记录。
在架构上,采用混合专家(MoE)架构,虽总参数大,但每次推理只激活3.06%(490亿),实现“大模型,低成本”。推理成本断崖式下降,100万token场景下,单token推理计算量仅为V3.2的27%,KV缓存压缩到10%,并发量提升3到4倍。
价格也极具竞争力,V4 - Flash输出2元/百万token,缓存命中后输入0.2元/百万token;V4 - Pro输出24元/百万token,缓存命中后输入1元/百万token。而且全栈拥抱国产硬件,还自研新技术降本增效。