五步走,两个月炼成!王小川的大模型打造秘籍曝光( 四 )


五月初,谷歌曾泄露出一份内部文件,这份文件声称:“我们没有护城河,也没有 。当我们还在争吵时,开源第三方已经悄悄地抢了我们的饭碗” 。
谷歌显然已经意识到了开源的影响,那么开源和闭源究竟哪一种模式更有效?
百川智能给出了他们的回答:
众所周知大模型的训练成本极高,因此以闭源保证商业投入是比较有效的方式 。
不过,开源创新早就已经成为了软件发展乃至于IT技术发展的一种主流技术形态,超级计算机的操作系统几乎都是用Linux这样的开源软件操作系统进行构建,智能手机的操作系统80%以上都由开源的安卓系统支持 。
在大模型出现之前,深度神经网络的学习框架也几乎都是开源的 。
虽然目前和谷歌都选择了“闭门造车”,但是Meta却走上了开源的道路,LLaMA开源之后迅速地吸引了大量开发者,这和互联网时代Linux,移动互联网时代的安卓十分相似 。
就像Linux和安卓都会在社区上开源出一个核心的版本,然后更多人在这个核心版本上根据他对需求和领域的理解进行不断地修改,低成本产生更多适应未来发展的新版本,由环境来评价,然后再迭代回来不断地开发 。
这种众人拾柴的研发路径在大模型时代无疑还将发挥巨大作用,开源和闭源究竟哪一个更有效现在还很难说,就像我们无法说iOS要安卓更有效一样 。
但是,未来的大模型生态一定会是垄断与开源并存 。
— 完 —