具身智能,是机器人的“冷饭热炒”吗?

大模型正如火如荼,下一个AI风口就来了 。
如果你关注2023世界人工智能大会等行业峰会,以及英伟达、微软、谷歌、特斯拉和国內科技大厂的最新发布会,除了“大模型”,应该会听到另一个高频词——具身智能 。
所谓具身智能 AI ,指的是有身体并支持物理交互的智能体 。
【具身智能,是机器人的“冷饭热炒”吗?】简单来说,就是让AGI从数字世界走向实体世界,落地在机器人、机械臂、无人车、无人机,让实体世界中的机器人/仿真人具有智能,像人一样与环境交互感知,执行各种各样的任务 。
从这个角度看,其实很多人都已经见过或者玩过具身智能产品了 。索尼的机器狗AIBO,软银的服务机器人,还有波士顿动力的人形机器人和机器狗……这些具身智能产品,曾是不少人的童年回忆,或者科幻恐惧 。
虽然技术概念很超前,但这些产品的市场表现,其实并不太理想,技术落地难、产品被停产、企业被转卖,都不算新闻 。
因此也有人认为,具身智能作为AI的终极形态之一,只是一些大厂推动的营销概念 。
我们今天就来聊聊,具身智能的这一波热度,是机器人的“冷饭热炒”吗?
下一个AI风口
古话说得好,遇到问题,先问是不是,再问为什么 。
有必要先探讨一下,具身智能真的火了吗?
目前来看,AI学术界和工业界,确实已经将“具身智能”,作为下一个风口 。
学术层面,不少科学家提出推论,大模型的技术路径打通之后,下一个突破是具身智能 。
图灵奖得主、上海期智研究院院长姚期智认为,人工智能领域下一个挑战将是实现“具身通用人工智能”,即如何构建能够通过自我学习掌握各种技能并执行现实生活中的种种通用任务的高端机器人 。清华大学计算机系教授张钹院士,也在某产业智能论坛上提出,随着基础模型的突破,通用智能机器人(具身智能)是未来的发展方向 。
(张钹院士的公开发言现场)
产业层面,谷歌、微软、特斯拉等科技公司近日都相继公布了自家的具身智能产品,国內头部科技大厂如华为、京东,也开始将自身在具身智能领域的相关布局,向大众布道 。前不久印发的《北京市机器人产业创新发展行动方案(2023-2025年)(征求意见稿)》,也提出发展机器人“1+4”产品体系,加紧布局人形机器人研发与应用 。具身智能的产业化、市场化潜力,正在加速积累 。
如前所说,无论是现实生活中的机器狗、机械臂、无人车,还是科幻电影中的人形机器人,具身智能产品早已为大众所熟悉,但市场表现一直不温不火 。为什么一夜之间成为风口了?
和大模型“两开花”
这一波具身智能的热潮,让我想起了这张梗图 。AGI起于大模型,终于具身智能 。
具身智能的概念,可以追溯到1950年,图灵在论文《and 》中,提出机器像人一样能和环境交互感知,自主规划、决策、行动,并具备执行能力,是AI的终极形态 。
历史上的两次人工智能浪潮,AI智能水平都达不到大众的预期,具身智能虽然诞生了波士顿动力这样的“炸裂”,但是作为一种未来概念和独特案例,并没有取得有成效的产业化进展 。
当下正在第三次人工智能浪潮,具身智能的希望重燃,就在于跟大模型“两开花” 。

具身智能,是机器人的“冷饭热炒”吗?

文章插图
具体来说,大语言模型让人们看到了AGI通用智能的希望,而这也让具身智能有了几个方面突破的可能性:
1.大模型——更厉害的“大脑”
我们知道,大语言模型和传统机器学习的区别,就在于泛化能力强,在复杂任务理解、连续对话、零样本推理等方向有了突破进展 。这一突破,让机器人的理解力、连续决策力、人机交互能力,有了全新的解决思路 。