垂直大模型,落地有多难?( 三 )


简单来说就是,一边在做底层大模型的同时,找准一个模型最终的主应用场景,一边收集用户数据并做出快速的迭代 。
目测,元语智能更偏向于这一类 。总结起来看,在很长的一段时间内元语智能都聚焦在自然语言大模型业务上 。
元语COO朱雷并表示,“不会为了跟风盲目拓展图片、视频业务,元语的目标是实现‘’等前沿语言大模型的全面国产化 。语言大模型的生态已经足够大了,做好业务聚焦很重要 。”
但对于其他往自动驾驶、工业生产等垂直大模型发展的创业公司来说,或许缺乏对一些特殊的行业数据掌握 。
毕竟,在垂直大模型赛道,未来企业竞争的一个核心因素,就是私有数据和私有经验,个体公司的流程并不被大模型者知晓时,可能就会有独特的竞争力 。
另外,业务聚焦的过程中,还需要到数据从源头到预训练、输出的准确性 。
目前,生成式人工智能在监管上也正在受到更多关注 。近日国内发布了 《生成式人工智能服务管理办法(征求意见稿)》,明确要求不得出现歧视,生成内容应当真实准确、防止生成虛假信息等,如果出现,除内容过滤外,还要通过模型优化等进行优化 。
但如果是作为生成式人工智能的固有缺陷,这在从技术上难以保证和彻底解决 。
此外,在更好的开源模型的出现,保不齐会伴随着更多跃跃欲试的公司会涌进来,这对于创业公司来说,有何尝不是竞争?
例如当下的Llama 2,7月18日,Meta公司发布了首个开源人工智能模型Llama的商业版本 Llama 2 。有企业认为,根据现在的各种评测文档,除了代码能力差一些,其实很多地方已经开始接近 。
或许未来开源社区的狂热浪潮会让具备基础能力的大模型普及化,以后私有化大模型就是白菜价 。直白一点来说就是,企业可能会非常便宜地使用私有化大模型 。
更重要的一个点是,汤道生曾表示:“通用大模型有很强的能力,但并不能解决很多企业的具体问题,在100个场景中可以解决70%—80%的问题,但未必能100%满足企业某个场景的需求 。但企业如果基于行业大模型,再加上自身数据进行精调,可以建构专属模型,打造出高可用的智能服务 。”
当然,这种私有化大模型还未到来,但赛道中的创业公司,一定是机遇和困境齐具 。
巴比特园区开放合作啦!
中文推特:
英文推特:
社区:
电报频道:
【垂直大模型,落地有多难?】电报社区: