戴尔推开源软件Omnia,自动化AI和HPC工作负载部署

戴尔(Dell)发布Omnia开源软件包,该工具可以通过创建一个灵活的数据中心基础设施资源池,来支持自动配置和管理HPC、人工智能以及资料分析工作负载。Omnia是由戴尔的HPC运算和人工智能创新实验室、英特尔和亚利桑那州立大学合作开发。

Omnia开源软件包是一组开源的Ansible Playbook,官方提到,Omnia可以加快Kubernetes、Slurm,甚至是函数库框架、服务和应用程序的融合工作负载部署。Omnia会自动将软件解决方案,诸如HPC模拟、人工智能的神经网络,或是资料分析用的内存图形处理等,发送到每台服务器上,有效缩短部署时间,从原本数周减少到只要数分钟。

Ansible最初由红帽创建,能够用来管理配置和部署应用程序,而Slurm则是Linux作业调度程序,受许多超级计算机或是计算机集群所采用。

戴尔集成解决方案资深副总裁Peter Manca提到,随着人工智能、HPC和资料分析逐渐融合,存储和网络配置仍然处于孤岛,而这使得IT难以针对不断变化的需求提供资源,Omnia可以简化高端运算工作负载的管理,加速企业研究和创新。

在部署Slurm工作负载管理器方面,Omnia通过组合Ansible Plays,以正确构建RPM文件并且进行部署,确保所有相依项目都已经安装,且能够正常执行,Kubernetes容器调度也能获得相同的方便性,Omnia使用由社群支持的Linux组件存储库,能自动执行创建多节点Kubernetes集群的所有步骤。Omnia还能用于开发环境的部署上,创建多用户的Python、R或Julia开发环境,可以替动态或是永久存储提供配置文件,还能自动部署机器学习平台Kubeflow等。

除了Omnia,戴尔的新发布还包括借由扩展HPC按需服务,来支持VMware虚拟环境,通过HPC按需服务和R Systems,用户可以在需要的时候,取用先进的基础设施来满足峰值运算的需求。随着VMware Cloud Foundation、VMware Cloud Director和VMware vRealize Operations加入服务阵容,用户能够使用混合云模型来处理资源密集工作负载,在需要的时候快速访问HPC资源。另外,戴尔现在也让用户在EMC PowerEdge R750、R750xa和R7525服务器中,可以选用Nvidia A30和A10 Tensor Core GPU。