今年随着英伟达领头力推开源大模型，大模型导向的研发更加明确。前阵子在深圳采访卓驭

今年随着英伟达领头力推开源大模型，大模型导向的研发更加明确。前阵子在深圳采访卓驭沈劭劼沈老师，再打捞复习一下，他近期对于大模型的一些看法。感觉国内至少在汽车领域，关于这部分的心得输出不多的。辅助驾驶以下基本上是原汁原味的输出：1. 模型的不确定性：首先【不确定性是必然有】，到现在我们的模型成功率已经高了很多。（但）我们也没有办法说答应我们客户，某个问题两周之内解决，这是（跟以前的开发方式比）最大的变化。一切东西是带概率，确实整体性能是在飞速提升，对于某一个特定的问题（的出现）是带概率性的。对于大模型也是一样，你去问ChatGPT说这个回答不对，你不可能给它提一个单指，你明天给我解决问题，解决不了。你只能等下一个大的迭代，这个本身也是数据驱动开发范式的一部分。另外今年（2025年）其实本身整个的行业，都是对模型到底什么东西才是关键的，其实是处于一个持续学习的过程中。这里只能说卓驭的例子。比如最开始训练网络的时候，我们肯定想这个网络自动驾驶安全性是一个高（优先级）的东西，网络有可能会输出一些错的结果，我需要进行安全兜底——最后发现兜得越多、性能越差，几乎所有那个车犯傻（的表现），就是应该绕行它不绕，大概率就是兜底逻辑打架了。也会想着让这个模型出很多条的轨迹，然后选到底用哪一条轨迹更好。后来发现，本身在训练的时候，训练会告诉网络喜欢啥、不喜欢啥，最开始也会以兜底的逻辑告诉我，把跟车距离、碰撞，把各种各样的车道线，是否压线的东西全部给它加进去，想着loss function都写完了，然后训练的网络都替换了。实际不是，网络是很狡猾，但是你自己考虑是不周全的，最终又会出现实际的产品打架的情况。到最后的最后，现在实际跑得最好的系统，它的loss function几乎没有，就很少，基本上就是一个你得【跟数据的匹配和相似程度越高越好】，输出的轨迹也没有很多条，就一条，兜底也基本没有了。但是你可能会问，那这个安全怎么保证，【安全是通过测评体系来保证】，就是我们花了很大的精力去建立一个测评体系。对一个网络出来到底及不及格，只要能过这个测评它就是及格的，通过测评体系的建设，把越来越多的兜底删掉了。以及关于数据的重要性，都说数据量大很重要，但是数据质量更重要，以及很多时候，今年我们有若干次大模型的提升，甚至都不是模型本身出现改变了，就是把数据的配比和数据的质量调对了而已，那性能就会出现比较大的提升。当然还会有一些属于行业级难题，到现在我们也还不是很清楚如何解决的。2. 基于大模型的主机厂合作的可能性也有一些项目，是我们自己跟主机厂做了前面小几个车型的适配开发，再往后的车型，直接由客户来进行适配，功能定义，完了之后自己写功能逻辑，写完了之后调用大模型。甚至再往后，我们可预见明年会出现一些模型的后训练，都能够由合作伙伴和客户自己进行调整，所以会一直说它是一个基座。基座的意思是可以在上面建东西。的确我们后续有不少的车型，卓驭就收这个基座模型的Lisence就可以了，我相信到这个模式之后，所谓的到底自研还是供应商方案，差异化还是标准化，这些就可以解决了。3. 基于大模型开发的组织架构数据驱动的开发范式，交付的结果是模型，但是最关键的还是整个公司的架构。公司的工作模式要适应这个状态才行，这里不只是技术人员，也包括举个例子：那在公司的财务上，每年给算力分配的费用占比是多少；在供应链成本上，给数据闭环分配的硬件成本会是多少；在做客户项目的时候，除了功能交付之外，对数据链路的通畅，如何把这个作为交付团队的KPI列进去。往回看，是涉及整个公司治理结构的事。

群发资讯网

今年随着英伟达领头力推开源大模型，大模型导向的研发更加明确。前阵子在深圳采访卓驭

热门分类