群发资讯网

今年随着英伟达领头力推开源大模型,大模型导向的研发更加明确。前阵子在深圳采访卓驭

今年随着英伟达领头力推开源大模型,大模型导向的研发更加明确。前阵子在深圳采访卓驭沈劭劼沈老师,再打捞复习一下,他近期对于大模型的一些看法。感觉国内至少在汽车领域,关于这部分的心得输出不多的。辅助驾驶 以下基本上是原汁原味的输出:1. 模型的不确定性:首先【不确定性是必然有】,到现在我们的模型成功率已经高了很多。(但)我们也没有办法说答应我们客户,某个问题两周之内解决,这是(跟以前的开发方式比)最大的变化。一切东西是带概率,确实整体性能是在飞速提升,对于某一个特定的问题(的出现)是带概率性的。对于大模型也是一样,你去问ChatGPT说这个回答不对,你不可能给它提一个单指,你明天给我解决问题,解决不了。你只能等下一个大的迭代,这个本身也是数据驱动开发范式的一部分。另外今年(2025年)其实本身整个的行业,都是对模型到底什么东西才是关键的,其实是处于一个持续学习的过程中。这里只能说卓驭的例子。比如最开始训练网络的时候,我们肯定想这个网络自动驾驶安全性是一个高(优先级)的东西,网络有可能会输出一些错的结果,我需要进行安全兜底——最后发现兜得越多、性能越差,几乎所有那个车犯傻(的表现),就是应该绕行它不绕,大概率就是兜底逻辑打架了。也会想着让这个模型出很多条的轨迹,然后选到底用哪一条轨迹更好。后来发现,本身在训练的时候,训练会告诉网络喜欢啥、不喜欢啥,最开始也会以兜底的逻辑告诉我,把跟车距离、碰撞,把各种各样的车道线,是否压线的东西全部给它加进去,想着loss function都写完了,然后训练的网络都替换了。实际不是,网络是很狡猾,但是你自己考虑是不周全的,最终又会出现实际的产品打架的情况。到最后的最后,现在实际跑得最好的系统,它的loss function几乎没有,就很少,基本上就是一个你得【跟数据的匹配和相似程度越高越好】,输出的轨迹也没有很多条,就一条,兜底也基本没有了。但是你可能会问,那这个安全怎么保证,【安全是通过测评体系来保证】,就是我们花了很大的精力去建立一个测评体系。对一个网络出来到底及不及格,只要能过这个测评它就是及格的,通过测评体系的建设,把越来越多的兜底删掉了。以及关于数据的重要性,都说数据量大很重要,但是数据质量更重要,以及很多时候,今年我们有若干次大模型的提升,甚至都不是模型本身出现改变了,就是把数据的配比和数据的质量调对了而已,那性能就会出现比较大的提升。当然还会有一些属于行业级难题,到现在我们也还不是很清楚如何解决的。2. 基于大模型的主机厂合作的可能性也有一些项目,是我们自己跟主机厂做了前面小几个车型的适配开发,再往后的车型,直接由客户来进行适配,功能定义,完了之后自己写功能逻辑,写完了之后调用大模型。甚至再往后,我们可预见明年会出现一些模型的后训练,都能够由合作伙伴和客户自己进行调整,所以会一直说它是一个基座。基座的意思是可以在上面建东西。的确我们后续有不少的车型,卓驭就收这个基座模型的Lisence就可以了,我相信到这个模式之后,所谓的到底自研还是供应商方案,差异化还是标准化,这些就可以解决了。3. 基于大模型开发的组织架构数据驱动的开发范式,交付的结果是模型,但是最关键的还是整个公司的架构。公司的工作模式要适应这个状态才行,这里不只是技术人员,也包括举个例子:那在公司的财务上,每年给算力分配的费用占比是多少;在供应链成本上,给数据闭环分配的硬件成本会是多少;在做客户项目的时候,除了功能交付之外,对数据链路的通畅,如何把这个作为交付团队的KPI列进去。往回看,是涉及整个公司治理结构的事。