AI大模型“国家队”定了( 二 ) _模型

与此同时，一批针对生物制药、遥感、气象等垂直领域的专业类大模型，正在发挥其领域纵深优势不断深化落地，提供针对特定业务场景的高质量专业化解决方案。
根据腾讯研究院、同济大学、腾讯云、腾讯新闻共同发布的《人机共生——大模型时代的AI十大趋势观察》报告，“大模型”已可以在多个领域催生出全新的商业价值，第一批跨功能的应用程序已在眼前：金融、零售、政府、制造、物流、地产、教育等多个行业，以及财务、HR、客服等应用场景，“大模型”展现了出色能力。报告预测，各行业都将迅速整合大模型的能力。与其他颠覆型技术一样，这种变革一开始会缓慢发展，然后迅速加速。
国内大模型列表如下
AI大模型实力哪家强？
为了更好地评估和比较这些模型在中文领域的表现，已经有针对中文的通用大模型的测评基准。
中文通用大模型基准（）就是其中的一个测评基准，尝试对主流的AI通用模型进行一个可量化的对比评分。它主要回答的问题是：在当前通用大模型大力发展的情况下，中文大模型的效果情况。包括但不限于：这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、这些模型与人类的效果对比。从三个不同的维度评价模型的能力：基础能力、专业能力和中文特性能力。其中专业能力包括中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等50多项能力。
近日，发布了大模型6月榜单。6月榜单由4部分组成：总排行榜、基础能力榜单、中文特性榜单、70亿参数量级榜单。
2023年6月中文大模型总排行榜
2023年6月基础能力榜单
2023年6月中文特性榜单
2023年6月-70亿参数量级榜单

文章插图
从榜单上的测评结果来看，GPT-4的综合能力和单项能力都表现非常出色，各榜单中GPT-4都是独占鳌头，比第二名GPT-3.5-turbo要强不少；其次是GPT-3.5-turbo、，二者评分旗鼓相当。
国内的几个大模型的表现只能说是有待加强，与GPT4的差距还是相当明显的，在AI大模型的竞赛中，国内模型的追赶步伐还得再快些，按360集团创始人周鸿祎话说，目前中国AI模型与GPT-4之间的差距在2到3年左右。
大模型时代的AI十大趋势
针对大模型AI技术发展，腾讯研究院、同济大学、腾讯云、腾讯新闻基于产学研等多方在AI领域的研究，共同发布了《人机共生——大模型时代的AI十大趋势观察》报告，从技术、应用、社会等角度，提出大模型时代的关键性趋势观察。
十大趋势分别为：LLM 推动人工智能快速进化到 AGI 阶段，多模态助力大模型解决复杂问题，生成式 AI 带来更贴近人的交互方式，模型即服务（MaaS）生态呼之欲出，垂直领域应用是大模型的主战场，工具让大模型迎来 App Store 时刻，大模型为数字人“注入灵魂”，AI 大模型将帮助个体成为超级生产者，版权“思想表达二分法”基石正在动摇，伦理和安全建设塑造负责任的 AI 生态。
技术趋势
大语言模型和多模态技术将助力人工智能向 AGI 发展
AGI（通用人工智能）是一种具有所有人类智能能力的机器，它可以理解、学习、适应和实现任何知识工作。报告显示，自 2010 年代初深度学习问世以来，人工智能进入到第三次高潮，而 2017 年出现的算法，又将深度学习推向了大模型时代。以为代表的大语言模型，展现出来的推理、思维链等能力，让人类感到惊讶，尤其是 GPT4 在多种能力测试中达到人类顶级水平，更是让人类看到了 AGI 的曙光。