国产大模型一般是开源的,但是最近有所改变。
有的大模型闭源发布;有的只开源小参数版本,不开源大参数版本;有的不允许商用,除非得到许可。我就不点名了。

“黑客新闻”的一个读者,针对开源大模型修改许可证这件事,提出质疑[1]:开源大模型可能无权设置许可证。
他的意思是,现在的开源大模型主要开源的是权重文件,以及配套的运行代码。所谓“权重文件”就是一个巨大的矩阵,表示各个 Token 在生成结果中出现的可能性。
权重是大模型的核心,而它来自于对海量语料的计算。这就是说,权重不过是计算结果,他认为,计算结果是没有版权的。
比如说,你写了一个程序,实现了一种更高效的根号2的算法。那么,这个程序是有版权的,但是计算结果根号2(1.414)是没有版权的。因为计算结果不过是机械过程的产物,不涉及人类创造力。
按照这种说法,权重根本没有版权,当然也就谈不上设置或修改许可证了。
我不是版权专家,不能确定这种说法对不对,但是听上去有道理。大家可以自己去问问大模型“计算结果有没有版权?”,看看大模型怎么回答。
References[1] 质疑: https://news.ycombinator.com/item?id=47738685