刚才刷到小米首次登顶全球开源大模型第一一整个惊到了。北大编译器那个项目4.3小时满分搞定,关键是一次做对不是碰运气过关,差距太大了。
TPS能干到100-150 token/s,价格砍半还支持百万上下文不区分计费,凌晨0点到8点再打8折。之前还觉得小米是手机厂,现在人家AI直接开源给开发者免费用。V2到V2.5才多久啊,迭代速度真的离谱。




刚才刷到小米首次登顶全球开源大模型第一一整个惊到了。北大编译器那个项目4.3小时满分搞定,关键是一次做对不是碰运气过关,差距太大了。
TPS能干到100-150 token/s,价格砍半还支持百万上下文不区分计费,凌晨0点到8点再打8折。之前还觉得小米是手机厂,现在人家AI直接开源给开发者免费用。V2到V2.5才多久啊,迭代速度真的离谱。



