脸书以PyTorch改写物体侦测函数库发布Detectron2

脸书在去年的时候发布了物体识别开发函数库Detectron,现在脸书重新以PyTorch改写发布Detectron2,新版本支持了多种新模型和功能,并把训练工作管线移到了GPU,让新版本的模型训练速度比Detectron快上许多,另外还采用了模块化设计,更灵活也更容易扩展。

Detectron是脸书人工智能研究员开发的计算机视觉函数库,可以快速地从视频或是图片中,识别物体,对象的形状和边缘。Detectron第一个版本以Python开发,使用深度学习框架Caffe2,但是Detectron2转换使用脸书在去年底发布的深度学习框架PyTorch,PyTorch可提供更直观的指令式程序设计方法,让研究人员能快速迭代模型和实验。

而全新的模块化设计,让Detectron2更灵活且容易扩展,用户可以将自定义的模块实例插入对象侦测系统各个部分中,也就是说,用户可以方便地使用Detectron2来完成其他人工智能研究,因为其撰写的研究实例程序代码,可与核心Detectron2函数库程序代码完全分离。

Detectron2除了提供Detectron中的所有模型,包括Faster R-CNN、Mask R-CNN、RetinaNet和DensePose之外,还新加入了Cascade R-CNN、Panoptic FPN和TensorMask,此外,脸书还添加了同步批处理规范,并支持LVIS等数据集。

Detectron2支持了一系列和物体侦测有关的新功能,在原始的Detectron版本,可用框、实例分割遮罩来标出侦测到的对象,以及预测人类动作,而Detectron2增加支持语义分割,还有结合语义分割和实例分割的全景分割。脸书将Detectron2的训练工作管线移动到GPU中,以提高整体的运行速度,现在用户还可以将训练分散到多个GPU服务器,让大型数据集的训练工作更加快速。

脸书也实例了额外的软件层Detectron2go,让开发者可以更简单地在产品中部署模型,Detectron2go的功能有内部数据集的标准训练流程、网络量化以及为云计算和移动设备模型转换优化。

脸书设计Detectron2是要满足自家人工智能研究的需要,并且为脸书产品提供物体侦测的功能,像是为Facebook Portal视频通话设备中的智能摄影机,提供下一代姿势侦测功能。脸书提到,把Detectron2用做跨研究以及产品中的统一物体侦测函数库,可以让他们快速地把研究中的功能,转移到大规模部署的产品模型中。