Google Chrome以AI帮视障用户“读”图片

对有视力障碍的人士来说,要浏览以图像为主的网页内容相当困难,现在Google Chrome浏览器将加入一项AI功能,为这群用户以语音“读”出网页图片内容。

为服务有视障问题的人士,网页设计师可在使用“Alt属性”或“Alt文本”。这类属性可在图片无法显示时出现一段文本来弥补。若用户有屏幕读取设备或点字设备,这些文本就可以被念出来,因而可作为视力障碍者的辅助工具。若网页设计师没有定义这些属性,有视障问题的用户就无法享受网页图片。

事实上,由于需要网页设计师花时间定义替代图片的文本,因此实际上效果并不好。现况是网页上数亿张图片都没有定义,因此当以屏幕读取器或点字显示器读取网页时,经常听到的是“图片”、“未标签的图片”,或是超级长但实际上完全无意义的图文件名称。

现在Google将引用AI功能来解决这个问题。这项功能运用Google Lens底层的机器学习光学字符识别(OCR)技术识别图片,本功能8月时还加入到Google Photo,可支持以关键字搜索图片。

Google解释,在用户以Chrome浏览器访问网站时,图片会被送到Google产出图片描述。如果Chrome打开屏幕读取器,就会听到图片描述,即使图片没有标签或替代文本。为了让用户清楚知道是AI产出的描述,不保证100%准确,描述文本会加上“看起来是”(appears to be),例如碰到Gogoro的图片,它会说“看起来是电动摩托车”,或是以“看起来是一只睡在沙发上的猫”来描述蜷伏在客厅沙发上的猫咪。

如果Google无法描述图片,屏幕读取器就会说“没有可用的描述。”

这项功能位于Chrome辅助功能(Accessibility)之下。要使用这项功能,Chrome用户可到“设置”、“高端”、“辅助功能”下,启动“取得Google的图片描述”。用户还必须具备屏幕读取器或点字显示器,因为这些描述只会有语音,不会有字幕。此外,目前本功能也只有英文版。

激活本功能时,用户还可以选择只对单一网页使用一次,或是所有网页都套用本功能,后者会要求用户同意接收Google的图片描述。用户若登录Chrome同步化,则所有同步的Chrome也都会启动图片描述。

Google并不是第一个以AI辅助视障用户的厂商。去年底脸书的Instagram(IG)就推出自动替代文本功能,除了以对象识别技术自动产生图片描述,供屏幕读取器念出来,IG也允许用户替上传的图片自定义取代文本,让屏幕读取器念出用户想要的描述。