AI大模型“国家队”定了( 二 )


与此同时,一批针对生物制药、遥感、气象等垂直领域的专业类大模型,正在发挥其领域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案 。
根据腾讯研究院、同济大学、腾讯云、腾讯新闻共同发布的《人机共生——大模型时代的AI十大趋势观察》报告,“大模型”已可以在多个领域催生出全新的商业价值,第一批跨功能的应用程序已在眼前:金融、零售、政府、制造、物流、地产、教育等多个行业,以及财务、HR、客服等应用场景,“大模型”展现了出色能力 。报告预测,各行业都将迅速整合大模型的能力 。与其他颠覆型技术一样,这种变革一开始会缓慢发展,然后迅速加速 。
国内大模型列表如下
AI大模型实力哪家强?
为了更好地评估和比较这些模型在中文领域的表现,已经有针对中文的通用大模型的测评基准 。
中文通用大模型基准()就是其中的一个测评基准,尝试对主流的AI通用模型进行一个可量化的对比评分 。它主要回答的问题是:在当前通用大模型大力发展的情况下,中文大模型的效果情况 。包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比 。从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力 。其中专业能力包括中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力 。
近日,发布了大模型6月榜单 。6月榜单由4部分组成:总排行榜、基础能力榜单、中文特性榜单、70亿参数量级榜单 。
2023年6月中文大模型总排行榜
2023年6月基础能力榜单
2023年6月中文特性榜单
2023年6月-70亿参数量级榜单

AI大模型“国家队”定了

文章插图
从榜单上的测评结果来看,GPT-4的综合能力和单项能力都表现非常出色,各榜单中GPT-4都是独占鳌头,比第二名GPT-3.5-turbo要强不少;其次是GPT-3.5-turbo、,二者评分旗鼓相当 。
国内的几个大模型的表现只能说是有待加强,与GPT4的差距还是相当明显的,在AI大模型的竞赛中,国内模型的追赶步伐还得再快些,按360集团创始人周鸿祎话说,目前中国AI模型与GPT-4之间的差距在2到3年左右 。
大模型时代的AI十大趋势
针对大模型AI技术发展,腾讯研究院、同济大学、腾讯云、腾讯新闻基于产学研等多方在AI领域的研究,共同发布了《人机共生——大模型时代的AI十大趋势观察》报告,从技术、应用、社会等角度,提出大模型时代的关键性趋势观察 。
十大趋势分别为:LLM 推动人工智能快速进化到 AGI 阶段,多模态助力大模型解决复杂问题,生成式 AI 带来更贴近人的交互方式,模型即服务(MaaS)生态呼之欲出,垂直领域应用是大模型的主战场,工具让大模型迎来 App Store 时刻,大模型为数字人“注入灵魂”,AI 大模型将帮助个体成为超级生产者,版权“思想表达二分法”基石正在动摇,伦理和安全建设塑造负责任的 AI 生态 。
技术趋势
大语言模型和多模态技术将助力人工智能向 AGI 发展
AGI(通用人工智能)是一种具有所有人类智能能力的机器,它可以理解、学习、适应和实现任何知识工作 。报告显示,自 2010 年代初深度学习问世以来,人工智能进入到第三次高潮,而 2017 年出现的算法,又将深度学习推向了大模型时代 。以为代表的大语言模型,展现出来的推理、思维链等能力,让人类感到惊讶,尤其是 GPT4 在多种能力测试中达到人类顶级水平,更是让人类看到了 AGI 的曙光 。