谷歌使用AI帮助视障人士“看见图片”
扫描二维码
随时随地手机看文章
Google Chrome上的TalkBalk是一项众所周知的辅助功能,可帮助视障人士浏览网络。但是,对于图像而言,它的用处远不大,因为它仅限于阅读图像描述,甚至经常被省略。现在,Google推出了一项新功能来提供帮助。
谷歌的辅助功能高级项目经理 Laura Allen 自己也有视力问题。她说,当尝试使用屏幕阅读器查看网站时,该功能将减轻许多麻烦。
“目前的不幸状况是,网络上仍然有数百万无标签的图像。当你使用屏幕阅读器或盲文显示器进行辅助时,实际上只会听到‘图片’或‘未标记的图片’,或者是完全不相关的超长数字串,即文件名。”
而 Chrome 的这项新功能会直接描述图片的具体内容,例如,它可能会告诉你:“这似乎是一辆小型摩托车。”该提示由 AI 生成,因此不一定精确,所以会在描述内容前加上“似乎是”这样的话语。
该功能仅适用于带有屏幕阅读器或盲文显示器的用户。用户只需转到 Chrome 设置>高级>辅助功能,然后选择“从 Google 获取图像描述”来启用它。也可以通过右键单击并拉出上下文菜单来启用单个网页的设置,在该菜单中可以找到相同的选项。
Chrome正式启动的自动图像描述,它使用机器学习算法来猜测图像的内容并生成文本描述。如果启用,此功能会将图片发送到Google服务器进行处理,然后阅读有关图片内容的说明(这些图片未存储在Google服务器上)。
该工具对于博客和社交媒体等独立来源的数百万张照片应该“超级有帮助”。最终,看到机器学习使每个人都可以更轻松地访问互联网真是令人兴奋。