解密大模型与文心一言

大家都能感受到,和百度文心一言这样的大模型非常火 。今天我们就聊一聊,它爆火背后到底是什么原因?接下来还会发生什么?我们每个人、每家企业如何参与其中?
这个现象的发生,有一部分是在大家的设想之中,也有一部分在大家意料之外 。甚至说,由于技术的快速发展,即使是身在其中的企业,对它的认知也在不断迭代中 。很多新生事物的发展,有很大的不确定性,我们往往对它的发展方向有个大致的判断,然后需要在实践中探索获得积极反馈,才能不断地往前走,这就是“反馈驱动创新”的理念 。
我们也希望跟大家一起,在新一波人工智能产业化浪潮中,共同去推动一些创新,推动人工智能技术的落地 。
接下来,我重点讲一下大模型 。这是当下最热、最前沿的人工智能发展方向 。
爆火,AGI曙光初现
有媒体报道说:没有任何一次产业方向,行业这么快地达成共识 。全球所有的大公司,都在往同一个方向去做——预训练大模型 。
我们定义当下是人工智能发展的“拐点”,而不是“终点” 。不是说,或者文心一言就是最终形态;而是说,它是人工智能发展到这个阶段产生的一个现象级产品 。接下来,还会有非常多现象级的产品出现,还会有更多的突破发生 。
这种基础设施级、操作系统级的创新,又意味着什么?让我们先回看一下历史——上面这张图,左边是中国过去40年GDP的增长曲线图;右边是过去2000年世界人均GDP的增长曲线图 。我们可以看到,在人类发展历史中,有很长一段时间,人均GDP是不怎么增长的 。但在最近的大约250年,GDP有了高速的、指数级的增长 。这个增长就是人类历史上的三次科技革命带来的,是创新驱动增长,科技创新驱动了大的增长 。
所以,对于当下我们所经历的现象,本质上是我们正在经历第四次工业革命 。人工智能是第四次工业革命的核心驱动力量,标志性技术就是深度学习算法 。这项技术能够驱动的经济增长,会比很多人想象得更大 。当下大家看到的是一些热门的应用方向,但是接下来,它会重塑整个经济、社会、产业和人们生活的方方面面 。
大模型智能涌现,人工智能迎来拐点
那为什么是今天?为什么是现在?
其实人工智能已经跌宕起伏,火了几十年 。它有过很多次被社会层面认知,受追捧,然后又冷却,又重新再受追捧 。大家应该都记得,当年的在围棋上打败李世石,就引发了巨大的关注 。
那么, 当下这波人工智能大浪潮有什么不同?我们知道,人工智能有三要素:算力、算法、数据 。今天,这三个要素的齐头并进,让人工智能技术产生了本质性的改变,来到了一个临界点 。
算法上的突破是最显著的,大模型背后核心技术就是深度学习算法 。数据上看,2020-2025 年,全球数据平均增速预计达到23% 。而且数据是越用越多,大量企业的数字化,还会不断产生更多的数据 。在算力方面,2006年-2020年,芯片计算性能提升了600多倍,未来可能还会有更大的突破 。今天大家还在讨论算力卡脖子,我们认为,到一定阶段算力也许都不是问题 。

解密大模型与文心一言

文章插图
算力、算法、数据三方面共同的狂飙突进,成就了今天人工智能的拐点来临 。
大模型带来了更高的生产效率:一是更少的训练数据 。预训练开发模式可以把训练数据量减少90%;二是更少的算力投入,通过端到端训练和微调,算力投入可以减少90%;三是更短的开发周期 。模型开发时间可以下降85%,从1周缩短到1天 。