据统计,全球有视力障碍的人群高达3.42亿人,其中5200万人属于中等收入家庭,单中国就有1700万成人具有不同程度的视力障碍。
为了帮助盲人可以读懂非盲文的文字信息,让视障人士阅读更多他们想要了解的世界。以色列的一家叫 OrCam 的科技公司就研发了一款特殊的辅助设备——OrCam MyEye2.0。专适用于视障人士、盲人以及阅读困难者的视觉辅助设备。
OrCam MyEye2.0是一款安装在眼镜上的摄像机。当佩戴者用手指指着想要阅读的文本并按下触发按钮,OrCam MyEye2.0就会通过耳朵边上的扬声器把文本内容以语音的形式读给佩戴者听!
那OrCam MyEye2.0 怎么识别文本内容呢?
OrCam MyEye2.0设备包含一个可以吸附在眼镜上的小型相机,用户指向一篇文章或一个物体,扬声器就会把图像转化成语言并读给用户。这样,盲人或有视力障碍的用户就可以“阅读”报纸、餐厅菜单或书籍。
OrCam在识别准确率和速度之间取得了比较好的平衡,随着被识别物体数量的增加,其所需的额外计算处理容量却在缩小。
OrCam My Eye2.0语音播报时,接听者依然能够听到外部的声音。不会因为语音过大对外界传递的声音一无所知,造成危险或忽略其他声音信息。
到目前为止,市面上帮助视力受损人群阅读的设备或笨重,或使用条件苛刻。新近也有出现智能机上的app,但多是功能有限。而OrCam无需任何网络,便可做到文字识别、人脸识别、物品识别以及钞票、颜色识别等功能。
OrCam的神奇之处还在于它还能向用户学习来识别新的物品。只需挥动一下手,轻点一下即可储存一个新面孔或者新地点,它会在你下一次遇见时准确无误的告诉你。
这一项技术进步显然是得益于芯片在处理能力和体积上的改良,加上图形算法的精进。在更广泛的技术层面来说,OrCam是一系列AI尤其是制造业的图形处理和无人驾驶汽车领域技术进步的体现(Shashua曾是一家无人汽车图像采集技术公司Mobileye的创始人)。在iPhone和Android手机上,数以千万的用户正在使用语言识别技术。同时,自然语言处理也在简化计算机“阅读”文件的过程。