IDC发布AI训练数据市场分析最新报告

近日,全球领先的专业市场调查机构IDC,分析了企业在人工智能应用开发的建设现状及在数据服务方面的挑战和需求,并发布调研报告称:澳鹏Appen作为一家全球领先的AI训练数据服务提供商,在中国市场提供覆盖AI全生命周期的数据解决方案,具备独特优势 。
IDC观点
?中国AI市场快速发展,各行业AI落地的渗透率在逐步提高 。
?企业采用AI的过程中,存在隐私问题和数据缺乏等挑战,对数据服务的需求正在发生巨大变化 。
?企业越来越重视AI数据以加快AI落地,对AI数据服务的需求越来越聚焦在质量、效率和安全 。
?澳鹏Appen作为一家全球领先的AI训练数据服务提供商,在中国市场具备独特优势,为企业提供AI生命周期中图像、文本、语音、音频和视频的全栈式采集和标注服务及解决方案,其产品提供成品数据集产品和智能数据标注On-/SaaS/平台来积极满足客户的各种需求,在外语类和自动驾驶数据服务领域优势突出 。
1聚焦中国人工智能市场,数据是关键
近几年,中国人工智能市场迅猛发展,对丰富而优质的数据源的需求日益增加,成为AI数据服务市场的重要驱动力 。据IDC预测,到2025年,中国人工智能市场整体规模将达到163亿美元,五年CAGR将超过美国,走在全球前列 。

IDC发布AI训练数据市场分析最新报告

文章插图
随着数字化转型进入深水区,企业对人工智能技术的探索从单点应用拓展到多个业务场景,从信息化进入更高级的智能化阶段 。根据IDC调研,AI技术在互联网、汽车、金融、政府、制造、能源、医疗等各行业中均已有所渗透,且正逐步从业务流程的“提质降本增效”向经营的全面智能化演进 。
然而与此同时,IDC在2021年的一项调研中发现,全球企业在AI部署的过程中,面临的三大挑战分别是:前期成本高、缺乏MLOps专业知识以及数据科学专业知识,紧随其后的是隐私问题,以及缺少训练和测试数据 。
深度神经网络广泛进入行业应用带来了海量的数据需求,然而,在模型相对发展成熟后,通过继续优化模型代码带来的业务效果提升有限 。因此,优化训练数据成为AI模型进一步大幅提升准确率的重要手段 。
在这样的背景下,企业Al研发越来越注重将资源投入到获取高质量训练数据的工作,而不只是模型训练 。IDC 调研发现,全球85%的受访企业表示花费了超过一半的人工智能开发投入用于数据准备 。
高精度数据标注平台
针对以上市场需求和痛点,高精度数据标注平台是澳鹏Appen在进入中国市场后结合海外实践经验,独立自主开发的适配中国市场特性的平台产品 。平台集成了丰富高效的标注工具、具备强大的工作流调度能力、通过对自有团队、供应商团队及百万级众包资源进行资源整合,可支持丰富场景海量数据的各种类型标注项目 。
平台可通过私有化部署、SaaS服务、或混合云部署方式交付,确保数据流转合规,加强数据安全管控 。平台将AI和模型能力有效地整合,以大规模人机协同的方式,支持海量数据采集、多语种多场景语音转写转译、3D点云目标跟踪和语义分割等功能,在各行业各领域为客户提供高质量的AI训练数据 。
目前,澳鹏平台在2021年已经支撑和服务了中国130+客户,700+个项目,完成了各种类型的AI应用的采集和标注服务的交付 。
3TA们眼中的最佳实践
某头部AI技术供应商:
公司以智能语音技术为核心,对数据服务的需求类型中超过一半的需求属于语音类数据采标服务,需求重点正在从成品数据集转向方言、小语种等定制需求,应用于家居、车载、医疗和教育场景 。与澳鹏的合作中,在数据采标服务的标准方面,沟通效率高、响应速度快、质量评估结果好 。