Meta自我监督学习算法Data2vec 毋须人类教导计算机可自己学习

Meta推出首款通过语音、图像和文本学习的自监督算法。由于无需依赖标签资料学习,能有效处理更多样化的任务。

Meta于官网声明上宣布,推出首款高性能、自监督算法Data2vec,以多种方式学习语音、图像和文本。与普遍通过标签资料学习的机器有别,Data2vec通过自我监督学习,从观察语音、图像和文本的结构学习,能以更有效的方法处理包括理解口语文本等的复杂任务。

AI会分别扮演“老师”与“学生”的角色,“老师”会得到一张小狗的照片,它会把照片的头部盖住,然后要求“学生”去预测这张图片是什么,再交出答案。通过无数次这样的预测令AI从中学习。在文本的学习上也是相同。

Data2vec以统一的方法来预测输入语音、文本或音频数据,使单个算法也能处理不同类型的数据输入,解决了现在自监督学习算法因无法处理多款数据而使用受限的问题。

由于Data2vec并非依赖标记资料学习,有助它学习世上更多不同范畴的知识,令人工智能可通过视频、文章和录音学习复杂的主题,例如足球比赛及不同的烘焙方法。此外,Data2vec也有助人类开发适应性更强、能执行更难和多多样化任务的人工智能。

数据源:Meta