CV未来,路在何方?李飞飞指路( 三 )


最后,的广泛影响使数据集接受了一些批评,也引起了一些创立之初没有充分考虑的问题 。
其中最严重的是人物肖像的公平问题 。尽管我们很早就知道要过滤掉一些诸如种族、性别歧视等公然诋毁的图像标签,但数据集中还是存在一些微妙的问题:例如那些本质上不是贬义,但应用不当可能会引起冒犯的标签 。
尽管这些公平问题很难完全消除,但也有一些工作致力于减轻偏差的影响 。
CV北极星在哪?
计算机视觉的下一步朝哪发展?
作者认为其中最具潜力的领域是具身人工智能( AI),即能够用于导航、操作和执行指令等任务的机器人 。
机器人并不是指有头、两条腿走路的人形机器人,任何在空间中移动的有形智能机器都是一种具身人工智能的形式,无论是自动驾驶汽车、机器人吸尘器,还是工厂里的机械臂 。正如旨在代表现实世界广泛而多样的图像一样,具身人工智能的研究需要解决人类任务的复杂多样性,小到叠衣服,大到探索新城市 。
另一颗北极星是视觉推理( ),例如理解一个二维场景中的三维关系等 。可以想象一个场景,即使是让机器人执行一个看似非常简单的指令,如「将杯子带回麦片碗的左边」也需要视觉推理 。执行这样的指令当然需要比视觉更多的东西,但视觉是一个重要的组成部分 。
理解场景中的人,包括社会关系和人的意图,又增加了另一个层次的复杂性,这种基本的社会智能也是计算机视觉的一颗北极星 。比如看到一个女人搂着腿上的小女孩,这两个人很可能是母女关系;如果一个男人打开冰箱,他可能是饿了 。但目前计算机还没有足够的智能来推断这些事情 。
计算机视觉,就像人类视觉一样,不仅仅是感知,还需要深入的认知 。毫无疑问,所有这些北极星都是巨大的挑战,比还大的挑战 。
通过看图片来识别狗或椅子是一回事,而思考和浏览无限的人和空间的世界是另一回事 。
但这是一组非常值得追求的挑战:随着计算机视觉智能的展开,世界可以成为一个更好的地方 。医生和护士将拥有一双不知疲倦的眼睛来帮助他们诊断和治疗病人,汽车将更安全地运行,机器人将帮助人类勇闯灾区来拯救被困者和伤员 。
而科学家们可以在更强大的智能机器的帮助下,突破人类的盲点,发现新的物种、更好的材料,以及探索未知的领域 。
添加 博主 获取一线大厂面试真题