文心一言“插刀”百度？ _一言

在出世半年，爆火将近2月后，中国版AI大模型终于崭露头角。
3月16日，百度于北京总部召开新闻发布会，主题围绕基于文心大模型技术生成式对话产品——文心一言，这也预示着中国首个类产品面世。在其正式推出前，市场早已波涛汹涌，首批生态合作伙伴阵容群星闪耀，兴业银行、科创信息、北京现代等超过650家知名企业及机构陆续官宣接入文心一言，寄希望抢占中国的第一波红利。
百度同时公布了文心一言的邀请测试方案。3月16日起，首批用户即可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。此外，百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约，搜索“百度智能云”进入官网，可申请加入文心一言云服务测试。
在此之前， AI大模型已在全球掀起军备竞赛，国际上谷歌、微软分庭抗礼， Brad、论战不断，国内闻风而动，百度、阿里、360、腾讯积极入场， AI FOMO点燃科技圈。其中，百度作为第一梯队传统的国产搜索巨头， All In AI之心尤为突出，市场甚至传言百度曾下3月必出产品的生死状，此前百度就已试水AI作画与产业级搜索引擎文心一格和文心百中。
在万众期待中，文心一言终于上线。无独有偶，近日推出-4 ，在文本准确性与逻辑架构方面实现了更为惊艳的突破。而与此相比令人玩味的是，发布会召开后，百度股价不涨反跌，不少梗图频现，消费者对产品预期之低可见一斑。
小小的发布会竟有如此奇效，不知百度是否心有悔意，其CEO李彦宏也直称文心一言并不完美，发布是因为有市场需求。对此，我们先来看看现场展示中文心一言的表现能力。
发布会现场，李彦宏展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。尽管被指责为录播，但也在一定程度上展示出文心一言的基本内核，展示类别已基本代表了当下文心一言的极限能力。
在文学创作方向，问题主要围绕《三体》进行询问，包括作品信息、核心内容、续写创作，从其回答表现来看，问题准确性与上下文的逻辑联系性表现尚可，以搜索引擎论已属优异，但类人性不足，可明显感知信息多从语料资料库中集成而来，并无直接对话之感。
在商业文案创作中，公司起名、、新闻稿创作能力更多侧重于考察语义的理解力，就这部分而言，笔者认为文心一言语义理解已可达标，在回答之余会自动增加冗余的额外解释，但整体内容更倾向于正确的废话。

文章插图
除了基本的文学方向，文心一言已可尝试解决含逻辑思维的数学推演题目，现场成功计算鸡兔同笼经典题型，并可发现题目中隐含的错误，但解答本质上和当下的小猿搜题、作业帮等第三方解题软件并无区别，部分与网页提取答案几乎一模一样。
同时反观-4 ，其在各种专业测试和学术基准上的表现与人类水平相当，不仅以前 10%的超强能力通过了模拟律师考试， SAT成绩达到710 ，且具备解决高难度数理逻辑，拆解多语言复杂题型，量子速读看论文总结摘要的能力。两相对比，文心一言在其面前宛如蚍蜉撼树，而由于录播缺乏真实性，甚至有部分弹幕戏言中美人工智能的分界线即为中国有人工，美国有智能。