脸书开源用于视觉和语言模型的深度学习框架

脸书最近开源发布能支持视觉和语言领域的深度学习框架Pythia,Pythia是创建在脸书自家的开源框架上PyTorch上,模块化和即插即用的设计能够使研究人员快速地构建、复制和检测AI模型,Pythia框架是为视觉和语言任务设计,像是与视觉数据相关的回答问题模型,以及自动为图片产生标题的模型,此外,Pythia也支持分散训练和多种数据集,还能自订损失函数、指标、调度和优化器。

Pythia框架的功能包含参考工具,能够显示之前模型的基准测试结果,并快速地评估新模型的性能,脸书表示,Pythia框架能够使研究人员进入视觉和语言子领域的过程更顺利,且能够更快地构建模型原型和执行实验,脸书的目标是要通过增加模型和结果的可重复性,来加速研究进展。