文心一言“插刀”百度?( 二 )


当然 , 文心一言也并未一无是处 , 起码在国内 , 其仍代表着第一梯队的水平 。
【文心一言“插刀”百度?】仅从技术而言 , 与当前主流的BERT与GPT系列不同 , 文心一言核心引擎为百度自主推出的NLP模型ERNIE , 2019年推出后 , ERNIE已迭代至3.0版本 。但从其发布论文来看 , 整体框架仍基于BERT模型改进 , .0主要针对BERT系列中的中文表现进行优化 , 2.0则通过增加预训练任务 , 设计多任务学习最大限度地从训练语料库中提取词汇、句法和语义信息 , 而3.0则补充知识实体关系的同时兼顾语言理解与语言生成的统一预训练框架 , 将自回归和自编码网络融合加入预训练 , 在训练时引入大规模知识图谱类数据 。根据百度官方数据 , ERNIE模型参数规模达到2600亿 , 超过GPT3系列的1750亿元约50% 。
而从模型差异看 , 两者都是基于模型架构 , 但GPT采用单向语言模型,而BERT采用双向语言模型 , 在实际操作时 GPT对于文本生成更为敏感,即如聊天、写作等语言生成方向表现优异 , 而BERT对于文本理解更为敏感 , 在问答、语义关系抽取更有优势 。基于BERT的ERNIE自然也天然继承其优点 , 并在知识图谱生成中增加了该优势 。
换而言之 , 仅以技术描述论 , 文心ERNIE类人性稍差 , 回答以精准理解为主 , 同时更多聚焦于本土化 , 在语义复杂的中文NPL处理中有显著优势 , 毕竟由于各种限制 , 即使是最新版本GPT-4测试的26种语言中也并未涵盖中文 。实际问答题体验中 , 当涉及中文语义理解时 , ERNIE表现突出 , 甚至部分胜于GPT3.5 。
例如在关于洛阳纸贵的回答中 , 文心一言可正确理解其的经济现象 , 古诗词的可读性和观赏性也更高 , 更符合国人的审美与品味 。
同样的问题 , 对比一下老版本 。可以看出 , 对此理解力相对较差 , 甚至开始胡编乱造答案 , 而在藏头诗的撰写中 , 拟定要求也与题干存在一定差异 。

文心一言“插刀”百度?

文章插图
另一可圈可点的方向是在多模态生成 , 文心一言现场AI生成文字、图片、音频、视频等能力较为亮眼 , 尽管技术在海报修改、方言输出仍相对有限 , 作为单一产品横向对标尚有难度 , 但从整体AIGC市场而言 , 表现已属不错 。作为对比 , 尽管GPT-4已可识别梗图、漫画 , 但在多模态方向仍未公开其他数据 , 此点后续也可期待 。
总体而言 , 尽管仍存在类人性差、输入限制等诸多不足 , 录播现场也无法判断流畅性与其他功能 , 但文心一言的语义理解、问答准确性以及逻辑能力已初步显现 , 但市场 , 显然并不买账 。
在发布会的节点中 , 百度股价一度应声跳水9.81% , 最低价格触及120港元 , 而纵观发布会现场的评论 , 也有众多用户发布看跌言论 。
究其缘由 , 无非是事前对文心一言抱有较高预期 , 而GPT-4的提前发布所展现的强大性能也让市场对于文心一言的比较门槛不断攀升 。从性能来比较 , 百度除在中文语义占据天然优势外 , 在数理处理、语言能力、信息整合与类人性方面与之可谓是天差地别 , 当用户畅想与文心一言进行融合认知性与情感性的智能对话时 , 得来的结果与此前搜索引擎似乎并无差异 , 失望之情自然是溢于言表 , 而百度如此焦急的推出产品 , 也被市场理解为迎合需求的炒作 , 滥竽充数之称充斥于市场 。