Microsoft Edge现在可以自动产生图说供屏幕阅读器使用

微软上周宣布,包括Windows版、macOS版与Linux版的Microsoft Edge都已内置“替代文本”(Alt Text)功能,可自动替网络上缺乏标签的图像或图表产生文本叙述,并通过屏幕阅读器读取,以惠及视障人士。

屏幕阅读器可用来替视障人士读取网页上的内容,包括文本以及含有替代文本的图像/图表,然而,微软的数据显示,屏幕阅读器所遇到的图像中,有超过半数都缺乏图像标签或替代文本。

当Microsoft Edge用户通过设置允许微软替用户创造图像描述(Get image descriptions from Microsoft for screen readers)之后,只要屏幕阅读器遇见缺乏标签的图像,Edge就会自动把图像送至Azure Cognitive Services的计算机视觉API进行分析,进而创造5种语言的文本摘录,也能识别嵌入于图像中的超过120种语言。该API支持包括JPEG、PNG、GIF及WEBP等常见的图片格式。

图片来源/微软

该自动化图说服务有某些限制,例如被网站作者标示为装饰用的图像,或者是文件小于50 x 50像素的图像(如图标),也无法分析太大的图像,此外,计算机视觉API也会排除色情或血腥图像。

不过,微软强调,最了解图像所要企图表达意象的一定是网站作者,再加上以机器学习算法来描述图像并不那么完美,而且品质不一,因此,最好的方式还是由作者亲自撰写图说,但当缺乏图说或图像标签时,由AI产生的替代文本还是优于什么都没有。

目前Microsoft Edge的替代文本功能只支持桌面版操作系统,尚未支持Android及iOS等移动平台。