别人卷大模型,阿里云递锤子?

文|光锥智能 , 作者|刘雨琦
4月11日 , 所有人都在盯着阿里云 。
不只是因为 , 这是继去年年底 , 阿里巴巴集团董事会主席兼CEO张勇接任阿里云智能集团CEO之后的第一次公开讲话 , 更是因为在大模型激战的时代 , 刚刚发布了“通义千问”大模型 , 阿里云此时的动作举足轻重 。
大模型毫无疑问是关注的重点 , 但让人意外的是 , 阿里没有像百度、商汤一样现场演示大模型的性能和参数 , 仅仅是介绍了这一模型的具体功能 。在这个大模型扎堆发布的4月 , 阿里似乎在刻意降低通义千问的存在感 。
“阿里所有产品未来将接入大模型进行全面升级” , 张勇在阿里云峰会上宣布 。
据光锥智能了解到 , 目前包括钉钉、天猫精灵、天猫、淘宝、闲鱼、盒马等产品接入了通义千问 。接入后 , 钉钉能够实现自动写工作方案、生成应用等功能 , 天猫精灵则提升了人机交互水平 。
正如微软一样 , 阿里想在用大模型把所有产品都做一遍 。
不同于的插件开放 , 百度文心一言急着让客户和合作伙伴接入测试 , 阿里全线产品智能化的背后 , 或许是张勇没有说出的后半句话:
现阶段 , 通义千问的重心并不是与同类型大模型进行外部的市场化竞争 , 而是补齐内部生态板块 。
01 不盖房子 , 做锤子钉子
要开发大模型就绕不开一个关键词“算力” 。
参考的发展路径 , 所需算力被分为两部分 , 一是硬件算力 , 即微软用数万颗英伟达A100芯片帮助打造的超算中心;二是云算力 , 云所形成的超强存储空间、计算空间是目前最低成本的解决方案 。
硅谷知名风投A16Z曾在博客中表示 , 生成式AI的大量资金最终都稳定地流向了基础设施层——以亚马逊AWS、微软Azure、谷歌GCP为主的云厂商 , 以及以英伟达为代表的GPU厂商 。
也就是说 , 无论是王小川还是王慧文 , 都绕不开采购国内云厂商的服务 。阿里云、华为云、腾讯云等云巨头 , 早就陈列在基础设施的采购名单里 。
张勇指出 , 大模型是一场“AI+云计算”的全方位竞争 , 超万亿参数的大模型研发 , 并不仅仅是算法问题 , 而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程 , 需要有超大规模AI基础设施的支撑 。
顺着这个思路便会发现 , 阿里云的做法是将基础设施进行到底 。
【别人卷大模型,阿里云递锤子?】那么 , 优秀的基础设施往往要具备两个特质:一是低成本、二是高性能 。

别人卷大模型,阿里云递锤子?

文章插图
对于算力来说 , 成本最大的门槛在于“贵” , 微软数万亿美金的投入 , 几乎拦住了所有人 。这也就不难理解 , 为什么张勇一直提到“降价” , 毕竟想要5G网络走入千家万户 , 第一件事就是把流量费用“打下来” 。
阿里云智能CTO周靖人在会上宣布 , 发布ECS企业级通用算力型U实例 , 价格对比一代主售实例最高可下降40% , 同时推出对象存储预留空间产品 , 价格最多可降70% 。
U实例整合了多种云服务器规格 , 无需进行复杂的资源配置 , 售价相比上一代主售实例降幅最高可达40% , 更适合Web应用及网站、企业办公类应用、离线数据分析、中小型数据库等典型应用场景 , 具备与其他同类产品一致的稳定性和用户体验 。同时 , 阿里云还推出了“0元升配”活动 , 符合条件的用户可免费升级至第7代ECS实例 。