文章插图
你知道吗?人类有 70%的信息获取来自于视觉 。但目前存在两个问题: ①人眼本身只能看到物理世界,无法看到其背后复杂的信息世界; ②人类的记忆力有限,视野有限,于是会出现看了就忘、视野窄等各种问题 。
科幻片里常见这样一种“人肉外挂”:通过一系列的技术改造,主人公(比如史塔克)眼前出现的一切物体都会被自动识别,什么名称、用途、用法用量,全都可以秒速反馈回来,并被即时载入到记忆中,过目不忘 。
如今,百度 App 和简单搜索 App 上最新推出的百度 Lens 功能把这种科幻场景往现实生活中拉得更近了一点!
文章插图
一、百度 Lens 是什么?
百度 Lens 是百度识图最新推出的基于移动端实时感知和云端视觉搜索的类人眼视觉 AI 能力,能够实现所见即所得的信息浏览体验 。
打开百度 Lens,无需拍照,Lens 将会在毫秒内自动扫描并锁定镜头内检测到的全部物体,即刻反馈“它是什么”,“它背后的相关信息”,让你随时随地拥有“移动的百科全书” 。
二、百度 Lens 可以做什么?
作为目前全球识别能力最广的智能相机,百度 Lens 已支持超过 30+场景的认知 。
例如:扫商品找同款比价格,扫植物学辨认技巧看养护知识,扫人脸测面相运势,扫菜品/食材看热量知功效做法、扫明星看八卦追行程、扫汽车了解型号价格、扫红酒查酒庄年份、扫题目搜答案看解析 。
文章插图
此外还有 AR 翻译、文字/图书/海报/药品/货币/电影等多品类的认知能力 。
三、百度 Lens 有什么重要意义?
1. 从行为层面,它将深度强化人眼视觉理解能力,改变人类认知事物的习惯并为未来的智能眼镜奠定坚实基础 。你可以借助 Baidu Lens 真正实现边走边看,不间断浏览,同时,依托于百度 Lens 背后的超级百度大脑,将确保为每个实物提供精准、深度的信息介绍,让你边看边学 。
2. 从技术层面,它首次实现了类人眼的对实时视频流数据的感知和认知能力 。百度 Lens 作为目前全球最快最稳定的跨平台实时视觉 AI 能力,可以嵌入到 /iOS 系统部署,在移动端和智能硬件中运行,并保持业内遥遥领先的性能和效果指标 。
四、百度 Lens 攻克了哪些技术难题?
为了达到类人眼的视力,人工智能必须充分调动起复杂且涉及众多环节的能力 。在这一过程中,百度 Lens 遇到并解决了4个核心问题 。
1、快速连续稳定地发现新物体
人眼对视觉信号反应时间170ms~400ms,新进入视野的物体能够被快速的看见,当视角发生变化时新视野的物体在被发现的同时,也能够建立与旧视野内物体的对应关系 。具体到技术上,分为两个问题:单帧图像的物体检测的性能和连续帧图像物体检测的稳定性 。
① 单帧物体检测的性能包含准确率、召回率和检测速度 。过深的 CNN,相应地耗时也都较长 。而且终端 GPU 相比服务器 GPU 的性能还要拉开十倍以上的差距,耗时更长 。
因此,我们选择构建轻量级的网络结构实现移动端物体检测,并且构建覆盖通用场景的百万级别通用物体检测图片数据集 。针对基础模型进行压缩,进一步提升预测速度,最终可支持在手机端实现单帧多目标检测耗时60 ms 以内,主要物体检测准确率和召回率均在95%以上 。
② 连续帧图像物体检测的稳定性是我们面临的一个新挑战,它关注解决的问题是如何量化衡量在连续帧上不断的进行物体检测时,物体是否被检测到的状态变化 。
- 暖气片需要多久清洗一次呢 铸铁暖气片有什么优点
- 女人婚外情的表现 女人婚外情多久会腻
- 大象一般怀孕多久才能生下一个象宝宝 蚂蚁庄园5月8日答案
- 淘宝宝贝降权多久能恢复?恢复后还能出售商品
- 老公要离婚挽回话术有哪些 婚外情断联多久会复燃
- 饺子包好别直接放冰箱,容易开裂还粘连,教你一招!放多久都没事
- 避孕药副作用有哪些,避孕药多久有效!
- 系统还原是什么意思?win10系统还原需要多久
- 口罩的保质期多久 夏天戴口罩感觉呼吸困难怎么办
- 维c片吃多久停一次 连续吃三个月维c算长期吗