数据标注是做什么的 3D数据标注是做什么的( 二 )


数据标注是做什么的 3D数据标注是做什么的

文章插图
文章插图
图片来源:人力资源和社会保障部
2020年4月26日,人社部发文正式宣布,“人工智能培训师”正式成为一个新职业,并被列入国家职业分类目录 。预计到2022年,国内外相关从业人员有望达到500万人 。
业,但“老师们”依然用密集而艰苦的劳动,辅助AI一步步走向成熟 。光鲜亮丽的AI技术大会,在台前是那么的美好,似乎注释者的日子也变得有些艰难了 。
“很容易犯错误,因为没有技术含量,但有准确性要求,”刘梦媛看着他目前的员工说 。每张图中要标注的点比较复杂,稍有偏差就会导致误差 。一张图错了,就会影响整个数据包,然后“回炉重造” 。
除了准确性,疲劳是注释者最大的敌人 。“做这行做久了,我清楚地知道客户想通过我们实现什么——就是把人脑当电脑用”,刘梦媛笑着说 。
大公司会用软件监控标注者的疲劳程度,也算是人性化的一种体现 。“但是小公司是要接手别人剩下的工作的,所以他们要努力争取时间 。“没错,刘梦媛的团队常年备有成箱的红牛和西洋参含片 。
AI快速发展的背后,是一批批“老师”的换血,离职率相当高 。“做文字标注的人越来越少,图像标注、语音、视频30%的周转率常年半开 。而且95后00后愿意做的人更少 。一般三个月后他们就不想继续工作了 。”
三年过去了,刘梦媛一直在和他的老同事说再见 。但是她坚持她无聊的工作 。她记不清自己标记了多少张图片,但感觉自己正踩在人工智能的大潮上 。
【数据标注是做什么的 3D数据标注是做什么的】对于那些新员工,刘梦媛也是这样描述的,“我们是一群走在智能时代前面的人” 。
巨人来了 。行业的分水岭出现在2019年初:几大互联网巨头意识到数据的重要性,着手建立自己的“数据工厂” 。
数据标注是做什么的 3D数据标注是做什么的

文章插图
文章插图
据媒体报道,截至今年3月,百度山西人工智能数据产业基地拥有超过3000名标注员,主要涉及自动驾驶、人脸识别等内容标注,其中86%的员工为90后;在北京、天津、济南和字节跳动武汉,还招募了4万名数据注释员 。腾讯直接把平台上线,让标注者成为一种“全民兼职”,也就是所谓的“众包” 。
巨头的加入一方面是为了市场和成本,另一方面也是为了数据安全,所以在内部成立专门的标注团队显然是个不错的选择 。但“模型的训练和数据需求是周期性的,任务不是持续的,今天有工作,明天有工作,所以人很容易流失,管理成本很高” 。刘梦媛可以理解大厂“众包”的原因 。“我让我的工作人员尝试了平台的兼职贴标,单个贴标几毛钱,一个月收入2000元左右,比外包多了一大半 。”
“大厂出手后,市场最后争夺的就是成本 。”那段时间,刘梦媛的公司业绩下降了40%,做出来的标记数据质量也差了很多 。
数据标注是做什么的 3D数据标注是做什么的

文章插图
文章插图
图片:Boss直聘
笔记显示,2018-2020年数据标注员的平均工资为5000-6000元 。如果晋升为项目总监或者更高级别的项目总监,月薪会更接近5位数 。到2021年,在一些外包“小厂”为了生存,这个工资标准不升反降 。