成功对标GPT-4o,国内首个所见即所得模型“浮出水面”

老虎财经 2024-07-11 15:00:56

汪鹏

ChatGPT引爆全球AI浪潮后,越来越多人看到了生成式人工智能带来世界的无限可能,随着大模型的发展逐渐进入关键转折点,商汤科技选择打造超级应用迎接AI的超级时刻。

对大模型的积极探索,正在不断拔高商汤科技增长的确定性。

近日,商汤科技全面升级“日日新5.5”大模型体系,发布国内首个所见即所得模型“日日新5o”。

据悉,“日日新5o”成功实现了实时的流式多模态交互,交互体验对标GPT-4o,实现全新AI交互模式。

作为大模型应用落地的“先行者”,商汤科技不断布局垂直领域应用,将大模型和千行百业有机结合,并借此整合高阶思维链数据,打造大模型超级应用。在这一过程中,商汤科技大模型的增长路径逐渐清晰。

大模型新标杆迎风起

著名管理顾问詹姆斯·莫尔斯曾表示:“可持续竞争的惟一优势来自于超过竞争对手的创新能力”,当下的商汤科技正凭借着强大的创新力,成为国产大模型新标杆。

据悉,今年4月商汤发布的“日日新5.0”是国内首个对标GPT-4 Turbo的国产大模型,短短两个多月时间,全新“日日新5.5”体系迎来多项升级。

“日日新5.5”模型训练基于超过 10TB tokens 高质量训练数据,包括大量高质量的人工合成数据,构建了高阶思维链。该模型采用混合端云协同架构,拥有 6000 亿参数,可最大限度发挥云边端协同,综合性能较“日日新5.0”平均提升30%。

相较于“日日新5.0”,“日日新5.5”在端侧上加大了模型的优化,提升了10%的性能精度,首包延迟下降40%,推理效率提升了15%。该模型速度大幅提升的同时,成本还大幅度下降。

最为重要的是,“日日新5.5”除了指标维度的提升,还推出了流式交互模型“日日新5o”,商汤科技董事长兼CEO徐立对此表示:“行业要进行变化,交互模式一定是先行的”。

通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,「日日新 5o」带来了实时的流式多模态AI交互体验。

据介绍,“日日新5o”能听会看更会找话题,就如同真人聊天一般的交流对话,这种交互模式特别适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。

根据展示内容,现场工作人员仅是和“日日新5o”打个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。

此外,工作人员随便翻开一本书的任何一页,“日日新5o”都能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结,这一切在瞬间即可完成,真正做到实时交互。

“日日新5o”还有着不俗的读取图形信息的能力,工作人员随手画了一只简笔画小兔子,“日日新5o”便直呼画得可爱,而后工作人员又画了一个微笑表情,它从这个平静的表情中捕捉到了笑意,工作人员又改了一笔把嘴巴画大增添了舌头,“日日新5o”看到后立马说道这表情开心多了。

应用落地“先行者”

“模型能力提升需深入行业,整合高阶思维链数据”,徐立如是表述,从中不难看出商汤科技欲将大模型与各行业结合,加速应用落地的决心。

事实上,商汤“日日新”体系下的生成式AI应用正在持续升级并不断拓展,满足更多用户需求的同时,赋能产业焕新升级。

值得注意的是,商汤科技颇注重端侧大模型研发,已支持在智能手机、平板电脑、VR一体机、车载电脑、智能台灯等多种IoT设备部署应用。

以基于“日日新”的AI Native 生产力工具——商汤小浣熊家族为例,代码小浣熊·个人升级版面世,响应速度提升5倍,代码精度提升10%,具备更强悍的模型能力、更丰富的插件功能和更完善的数据看板。

“办公小浣熊”则全新发布网页个人版和小程序版,让用户可以在小程序中直接插入并分析处理微信聊天中的文件,更高效、更便捷。

此外,商汤商量拟人大模型Pro版本同样表现亮眼,自发布上线后,日均使用时长130分钟,用户次日留存率高达50%,人均对话轮数达90次,Pro版本可实现行业领先的角色对话、人设、及剧情推动能力,让智能体更像栩栩如生的人。

除了上述应用,商汤科技还推出端侧模型矩阵,包括商量Mini写作助手、总结助手和百科助手等特化模型,专项模型在对应场景下性能更优,针对客户复杂业务场景选择或定制不同专项模型。

然而,商汤科技并不满足于此,为了更好地服务端侧用户,公司不仅在端侧模型上提升性能——SenseChat Lite-5.5 版本的性能目前是所有端侧模型中的第一;还不断优化其推理速度及推理首包延时。

值得一提的是,前段时间OpenAI API在中国无法使用,为了更加方便用户,商汤科技“日日新 5.5”推出了“大模型0元Go”,借此帮助用户免费做大规模的迁移工作,为了服务更多的产业和行业客户,公司还送出了5000万的token包。

大模型“焕新”千行百业

通过大模型赋能千行百业,正在成为一种共识。

2024年政府工作报告就曾指出,制定支持数字经济高质量发展政策。深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。

事实上,根据《2024全球数字经济白皮书》内容,截至2024年,全球人工智能大模型1328个,中国占36%;截至2024年一季度,全球AI企业近3万家,中国占15%。这均意味着,中国已然成为大模型“生长的沃土”。

在这一背景下,商汤科技加速沉淀,力求进一步赋能各大行业。目前,商汤日日新大模型体系已有超过3000家政府、企业用户,广泛覆盖互联网、医疗、金融和编程等众多垂直行业,深入业务流程,促进提效降本。

具体来看,金融大模型推出金融智脑Agent,以专业垂域Agent能力在合规、营销辅助、数据开发、投研等金融领域场景实现质效提升;农业大模型可助力农情分析效率提高5倍以上,农资使用量降低20%,作物单产增加15%;文旅大模型可将旅行规划效率提升8倍,票务预定效率提升4.5倍,数据分析效率提升千倍。

值得一提的是,不同于多数未能实现造血的同行,商汤科技快速将大模型转化为了业绩支撑。据公司2023年财报数据,商汤科技生成式AI业务飞速发展,报告期内,商汤科技的生成式AI业务实现收入11.84亿元,同比大幅增长199.9%,占总收入的比重也从10.4%跃升至34.8%。

正如徐立所言:“真正让大家用得起人工智能的大模型,AI才会进入它的超级时刻”。为此,商汤科技已将商量端侧大模型每台设备的使用成本降低至仅需每年9.9元,以极致性价比、高可用性、超低门槛,加速大模型在端侧的规模化落地,目前已有超过150位客户启动商业对接。

随着商汤科技的不断布局,一个为迎接AI超级时刻而诞生的超级应用,正逐渐浮出水面。

1 阅读:100