数据标注是做什么的 3D数据标注是做什么的


数据标注是做什么的 3D数据标注是做什么的

文章插图
文章插图
上个月,特斯拉首席执行官马斯克表示,他将在明年推出“特斯拉机器人”(Tesla Bot)人形机器人的原型,从事人们不喜欢做的危险、重复或枯燥的工作 。该计划一经发布,便引起广泛讨论,外媒关注的焦点集中在安全方面 。然而在国内,隐藏在人工智能产业链中的一群人“小人物”开始浮出水面,被舆论聚焦 。
他们是AI产业的使能者,是人工智能背后的“劳动力” 。AI繁荣的背后,是万亿级的数据信息 。在装配线上,这些数据最终将被传输到名为“标注器”的计算机,并由它们手动“智能” 。
他们扮演了“老师”的角色——手拉手教真实世界的表情和动作,然后等着AI这个“学生”长大离开 。也许有一天这些“AI学生”会取代“老师” 。如今,随着数据标注行业的迭代升级,这些数据标注者可能很快就会离开舞台…
进入并扎根在上海的一个创意园区,主管刘梦媛(化名)正坐在自己的小隔间里,等待着批注者发来的成型文件 。
外面站满了员工,一个接一个,头紧贴着屏幕,脖子还在前倾 。其中一名员工正在做“标记点”,将视频逐帧截取放大,详细标记面部特征和骨骼弯曲点 。由于拍摄图像的像素较低,大多数员工总是习惯性地一边滑动鼠标滚轮一边叹气 。
数据标注是做什么的 3D数据标注是做什么的

文章插图
文章插图
员工操作的“标记点”是人脸识别前的重要步骤之一 。除了“标志点”,还有分类标志、框架标志等 。AI不是生来就能识别人的眼睛耳朵鼻子嘴巴的 。需要通过标注者绘制的关键点来建立对五官轮廓的认知 。在此基础上,AI可以通过这些点组成的轮廓特征来完成一系列的识别工作 。
当你“刷脸”解锁手机,完成支付,当你进入火车站,检票设备扫描你的脸,你都在使用人脸识别的技术 。帮助这项技术的是数据注释者 。
在刘梦媛的公司里,注释者通过细微而起伏的鼠标点击创建了数千个关键点 。这份工作很“初级”,但也很难 。刘梦媛偶尔会出来看看房子,然后以一种奇怪的方式回到小隔间 。“我过去常这样来这里 。很正常 。”
她2018年开始职业生涯,从机械输入(数据清洗)开始,几个月后才正式接触数据标注 。她的首要任务是给图像中的人物贴标签:年龄、性别、种族、头发、表情等 。供AI学习 。看了很多人的标签,AI就像一双锐利的眼睛,一眼就能认出人的特征 。
“当时税后五千多的工资主要是因为门槛低 。其实说到底还是互联网打工者的作用” 。那时,刘梦媛大学毕业后几次求职都失败了 。在她失意的时候,偶然遇到了“注释者” 。女孩特有的细心和坚韧让她一直坚持到现在 。
也是在刘梦媛入行的2018年,数据标签公司的风口来了 。据前瞻产业研究院统计,2017年与数据标签相关的融资事件共有9起 。截至2021年4月,共有18家公司获得融资,投融资事件39起 。
数据标注是做什么的 3D数据标注是做什么的

文章插图
文章插图
资料来源:前瞻产业研究所
顺应这一趋势,许多数据服务公司也作为乙方进入不断扩大的市场,为百度、阿里等大型互联网公司以及一些AI独角兽公司提供服务 。