Meta自我监督学习算法Data2vec 毋须人类教导计算机可自己学习

Meta推出首款通过语音、图像和文本学习的自监督算法。由于无需依赖标签资料学习，能有效处理更多样化的任务。

Meta于官网声明上宣布，推出首款高性能、自监督算法Data2vec，以多种方式学习语音、图像和文本。与普遍通过标签资料学习的机器有别，Data2vec通过自我监督学习，从观察语音、图像和文本的结构学习，能以更有效的方法处理包括理解口语文本等的复杂任务。

AI会分别扮演“老师”与“学生”的角色，“老师”会得到一张小狗的照片，它会把照片的头部盖住，然后要求“学生”去预测这张图片是什么，再交出答案。通过无数次这样的预测令AI从中学习。在文本的学习上也是相同。

Data2vec以统一的方法来预测输入语音、文本或音频数据，使单个算法也能处理不同类型的数据输入，解决了现在自监督学习算法因无法处理多款数据而使用受限的问题。

由于Data2vec并非依赖标记资料学习，有助它学习世上更多不同范畴的知识，令人工智能可通过视频、文章和录音学习复杂的主题，例如足球比赛及不同的烘焙方法。此外，Data2vec也有助人类开发适应性更强、能执行更难和多多样化任务的人工智能。

数据源：Meta