解密大模型与文心一言( 二 )


文心大模型
人工智能时代,应用会基于大模型来进行开发 。
百度的文心大模型,是由百度智能云的AI大底座训练出来的 。同时,AI大底座又包含了文心大模型的能力,并服务千行百业 。
百度智能云的AI大底座,是全栈自研的,是一个全要素、端到端的AI基础设施,包括了推理芯片昆仑芯、基于产业实践的深度学习框架飞桨、文心大模型,还有上层的产业应用 。
【解密大模型与文心一言】在这四层架构上,都能做端到端的优化,性能和效果、效率就能达到极致 。比如说,千卡的加速比可以提升90%,资源的利用率可以提升70%,开发效率可以提升100% 。
当我们讲百度文心大模型,我们要强调的是,它是产业级的知识增强大模型 。
“产业级”,指的是我们的文心大模型是来自产业,应用于产业的大模型 。它是在产业实际应用中真正产生价值的一个模型,这是我们非常有特色的一个地方 。业界一些大模型,其实是既没有应用场景,也没有真正的用户和客户 。
“知识增强”,指的是我们的文心大模型,它不仅从无监督的语料中学习知识,还通过百度多年积累的海量知识中学习 。这些知识,是高质量的训练语料,有一些是人工精标的,有一些是自动生成的 。比如搜索和点击数据,信息流上打的标签,这些都是经过大量的规则和模型训练优化过的数据 。再比如,我们有全世界最大的中文知识图谱数据,有5500亿事实,这些都可以作为大模型的输入 。文心大模型参数量非常大,达到了2600亿 。
全球性AI再造拉开序幕
云计算游戏规则根本性改变
大模型浪潮,带来了全球性的AI再造 。那它的本质是什么呢?是生产经营效率和用户体验效率的“双效”提升,这将加速社会的 “智能化跃迁” 。
一个是从供给端来看,生产经营的效率将会得到极大提升 。大模型和生成式AI已经可以帮我们写代码、写合同、写PPT 。而接下来,多模融合的生成式AI,则会更深入地重塑我们生产的全流程 。

解密大模型与文心一言

文章插图
另一个是从需求端来看,用户体验的效果将会得到极大提升 。基于生成式AI的各种数字人,或者叫做个性化助理,会帮助我们解决健康、理财、法律等一系列问题;人和机器的交互界面也会更加自然、友好 。除了生成文字之外,未来通过plug-in,就是接口的方式,你跟它讲讲话,它就可以上携程,帮你把酒店机票都订完了 。对用户来讲,这个体验变得非常好,不用在各种APP之间跳转 。
人工智能可以把所有的行业再造一遍 。过去拥有优势的企业,可用它来巩固自己的优势 。过去优势不很明显的企业,则有机会在新的阶段,用它来建立自己独特的竞争优势 。
数以千计的创业公司,也正在用生成式AI来改造千行百业 。全球性的AI再造已经势不可挡 。每个企业需要重新思考,自己的优势是什么、如何用AI来放大这个优势 。
文心一言大语言模型,会带来哪些创业机会、投资机会?我们认为,至少有三方面的机会 。
一是新型云计算公司 。我们认为,它适合少数大型科技公司,因为它需要大量的技术创新和突破+大量的人才+超大规模的数据+超大规模的算力,然后才能打磨出大语言模型,成本非常高 。也没有必要每个公司都去搞一个大语言模型 。大模型做得好的公司,它就会成为下一代的云计算领导者 。
二是行业模型精调,是中间层,适合一些高科技创业公司,它可以基于通用大模型做一些有创造性的工作 。除此之外,还有大型的集团型企业、集团中心、产业园区,也可以作为中间层的玩家 。这几类公司,可以构建它所在行业的行业大模型,然后形成行业的数据闭环,根据业务需求对大模型进行精调,激发出大模型在行业里面的特定能力 。