ChatGPT除了模型, 各个大厂、中厂、小厂们还在卷什么?

问世后,各大公司都在「大模型」上下了苦功,模型能力也成为大家最关注的话题 。虽直接定义了基于大模型的生成式对话机器人这个产品类型,其模型的强大也导致大家都忽略了它在产品使用上的问题 。
其实不管是底层模型开发的大厂还是专注于应用层的小厂,又或者是开源的独立开发者,都在模型能力之外的产品体验上暗自较劲,以不同的姿态参与到这场能够定义新的人机交互方式的对话革命中来 。
那除了模型,他们还在「卷」些什么?
大厂:专注模型,体验略显「简陋」,主打一个 less is more :三件套框架定义极简
作为行业标杆,直接定义了生成式对话机器人行业标准 。免费版本的 早期只有对话、对话管理以及简单的主题设置功能,靠着模型能力席卷全球 。随着用户的增多和抱怨,的产品经理也坐不住了开始逐步增加一些功能 。
最令人深刻的当属to Plus,牢牢霸占左下角的设置页,一眼望过去只有两个字,「充钱」 。除此之外,也逐步增加了主题设置、隐私管理等功能,但仍然突出一个克制,颇有小龙哥真传 。
付费版主要的区别在于增加了模型切换的按钮,以及在设置中增加了 Beta的功能,可以使用联网搜索功能或者使用其他插件 。
Bard & Bing:非差异化竞争
三巨头的剩下两家Bard 以及 Bing Chat 也都各有各自的风格,但总体上还是维持着极简风 。
Bard 的功能设计逻辑与几乎一致:对话功能为主,融合必要的对话管理、账户管理以及界面设置功能 。作为搜索大拿,Bard 在对话的基础上也引入了搜索的功能,能够自然地根据问题引入搜索,并呈现融合处理过的结果,体验上更加 up to date 。对于天气、实时信息的查询都表现良好 。
大模型在生成答案时会有多个答案并且有相应的权重,Bard 的「查看其他答案」功能给用户提供了更多选择,当我询问北京市天气的时候,它甚至给出了文字版本、表格版本和极简版本,非常惊艳 。
值得一提的是,Bard 的回答生成在交互方面是一次性生成而非打字机模式(文字一个一个出现,有打字机效果,参考 ),缺乏了生成过程,体验上感觉不够丝滑 。
与和Bard 不同的是,Bing Chat 的定位是基于搜索的,它的工作原理是从输入中总结搜索关键词进行搜索,然后对搜索结果进行总结 。每一条回复都会引用相应的来源,这同时导致它在创造力方面更缺乏,但是来源可考、保证了准确性 。
Bing 同样也是极简风,整体的产品界面设计与其他两家区别不大,但色彩上明显更活泼一些 。功能上最开始甚至连对话管理的功能都没有,聊完了您就清空,不留下一丝痕迹 。后来才增加「最近活动」的功能,用户能够看到自己最近的对话 。
Bing 唯一的特点在于设定了三种对话样式:更有创造力、更平衡、更精确,能够根据此参数确定模型是更精确还是更有创造性,这与 GPT 模型中的高级参数是对应的 。然而因为无法同时对比几个模式,在使用体验上用户很难感受到差别,即使是更有创造力的选项,受限于 Bing 更偏向搜索的定位,搜出的结果依旧缺乏创造力 。
对比下来,三巨头比拼的主要还是模型能力,目前还是比较领先;Bard 比较好地融合了搜索和生成两种模式,体验上是更优秀一些,Bing 则缺乏使用上的亮点,但靠着一句 GPT-4 模型就足以吸引大部分用户 。
中小厂:深耕体验,能力之上体验狂卷
不同于大厂卷模型能力,中小厂和个人开发者们更多将注意力放在了模型层上的应用层,依托各家大厂的底层模型能力,在功能和体验方面卷的飞起 。