文心一言“插刀”百度?

在出世半年 , 爆火将近2月后 , 中国版AI大模型终于崭露头角 。
3月16日 , 百度于北京总部召开新闻发布会 , 主题围绕基于文心大模型技术生成式对话产品——文心一言 , 这也预示着中国首个类产品面世 。在其正式推出前 , 市场早已波涛汹涌 , 首批生态合作伙伴阵容群星闪耀  , 兴业银行、科创信息、北京现代等超过650家知名企业及机构陆续官宣接入文心一言 , 寄希望抢占中国的第一波红利 。
百度同时公布了文心一言的邀请测试方案 。3月16日起 , 首批用户即可通过邀请测试码 , 在文心一言官网体验产品 , 后续将陆续开放给更多用户 。此外 , 百度智能云即将面向企业客户开放文心一言API接口调用服务 。3月16日起正式开放预约 , 搜索“百度智能云”进入官网 , 可申请加入文心一言云服务测试 。
在此之前 , AI大模型已在全球掀起军备竞赛 , 国际上谷歌、微软分庭抗礼 , Brad、论战不断 , 国内闻风而动 , 百度、阿里、360、腾讯积极入场 , AI FOMO点燃科技圈 。其中 , 百度作为第一梯队传统的国产搜索巨头 , All In AI之心尤为突出 , 市场甚至传言百度曾下3月必出产品的生死状 , 此前百度就已试水AI作画与产业级搜索引擎文心一格和文心百中 。
在万众期待中 , 文心一言终于上线 。无独有偶 , 近日推出-4 , 在文本准确性与逻辑架构方面实现了更为惊艳的突破 。而与此相比令人玩味的是 , 发布会召开后 , 百度股价不涨反跌 , 不少梗图频现 , 消费者对产品预期之低可见一斑 。
小小的发布会竟有如此奇效 , 不知百度是否心有悔意 , 其CEO李彦宏也直称文心一言并不完美 , 发布是因为有市场需求 。对此 , 我们先来看看现场展示中文心一言的表现能力 。
发布会现场 , 李彦宏展示了文心一言在五个使用场景的表现 , 包括文学创作、商业文案创作、数理推算、中文理解和多模态生成 。尽管被指责为录播 , 但也在一定程度上展示出文心一言的基本内核 , 展示类别已基本代表了当下文心一言的极限能力 。
在文学创作方向 , 问题主要围绕《三体》进行询问 , 包括作品信息、核心内容、续写创作 , 从其回答表现来看 , 问题准确性与上下文的逻辑联系性表现尚可 , 以搜索引擎论已属优异 , 但类人性不足 , 可明显感知信息多从语料资料库中集成而来 , 并无直接对话之感 。
在商业文案创作中 , 公司起名、、新闻稿创作能力更多侧重于考察语义的理解力 , 就这部分而言 , 笔者认为文心一言语义理解已可达标 , 在回答之余会自动增加冗余的额外解释 , 但整体内容更倾向于正确的废话 。

文心一言“插刀”百度?

文章插图
除了基本的文学方向 , 文心一言已可尝试解决含逻辑思维的数学推演题目 , 现场成功计算鸡兔同笼经典题型 , 并可发现题目中隐含的错误 , 但解答本质上和当下的小猿搜题、作业帮等第三方解题软件并无区别 , 部分与网页提取答案几乎一模一样 。
同时反观-4 , 其在各种专业测试和学术基准上的表现与人类水平相当 , 不仅以前 10%的超强能力通过了模拟律师考试 , SAT成绩达到710 , 且具备解决高难度数理逻辑 , 拆解多语言复杂题型 , 量子速读看论文总结摘要的能力 。两相对比 , 文心一言在其面前宛如蚍蜉撼树 , 而由于录播缺乏真实性 , 甚至有部分弹幕戏言中美人工智能的分界线即为中国有人工 , 美国有智能 。