Google Chrome以AI帮视障用户“读”图片

对有视力障碍的人士来说，要浏览以图像为主的网页内容相当困难，现在Google Chrome浏览器将加入一项AI功能，为这群用户以语音“读”出网页图片内容。

为服务有视障问题的人士，网页设计师可在使用“Alt属性”或“Alt文本”。这类属性可在图片无法显示时出现一段文本来弥补。若用户有屏幕读取设备或点字设备，这些文本就可以被念出来，因而可作为视力障碍者的辅助工具。若网页设计师没有定义这些属性，有视障问题的用户就无法享受网页图片。

事实上，由于需要网页设计师花时间定义替代图片的文本，因此实际上效果并不好。现况是网页上数亿张图片都没有定义，因此当以屏幕读取器或点字显示器读取网页时，经常听到的是“图片”、“未标签的图片”，或是超级长但实际上完全无意义的图文件名称。

现在Google将引用AI功能来解决这个问题。这项功能运用Google Lens底层的机器学习光学字符识别（OCR）技术识别图片，本功能8月时还加入到Google Photo，可支持以关键字搜索图片。

Google解释，在用户以Chrome浏览器访问网站时，图片会被送到Google产出图片描述。如果Chrome打开屏幕读取器，就会听到图片描述，即使图片没有标签或替代文本。为了让用户清楚知道是AI产出的描述，不保证100%准确，描述文本会加上“看起来是”（appears to be），例如碰到Gogoro的图片，它会说“看起来是电动摩托车”，或是以“看起来是一只睡在沙发上的猫”来描述蜷伏在客厅沙发上的猫咪。

如果Google无法描述图片，屏幕读取器就会说“没有可用的描述。”

这项功能位于Chrome辅助功能（Accessibility）之下。要使用这项功能，Chrome用户可到“设置”、“高端”、“辅助功能”下，启动“取得Google的图片描述”。用户还必须具备屏幕读取器或点字显示器，因为这些描述只会有语音，不会有字幕。此外，目前本功能也只有英文版。

激活本功能时，用户还可以选择只对单一网页使用一次，或是所有网页都套用本功能，后者会要求用户同意接收Google的图片描述。用户若登录Chrome同步化，则所有同步的Chrome也都会启动图片描述。

Google并不是第一个以AI辅助视障用户的厂商。去年底脸书的Instagram（IG）就推出自动替代文本功能，除了以对象识别技术自动产生图片描述，供屏幕读取器念出来，IG也允许用户替上传的图片自定义取代文本，让屏幕读取器念出用户想要的描述。