跨入AI安全领域,Nvidia推出专属应用框架Morpheus

经过多年以来的发展,GPU大厂Nvidia已陆续发展出多种针对不同产业与场景的应用软件框架,像是:Clara是用于医疗看护,Isaac是用于制造业机器人与自动化,Metropolis是用于智慧城市,Aerial用于5G通信,Maxine用于视频会议服务;有些应用软件框架可以支持多种产业,像是支持对话式AI的Jarvis,以及提供推荐系统功能的Merlin,能用于零售业与电子商务。

而在今年4月举行的GTC大会期间,Nvidia除了继续强化上述应用软件框架,出乎众人意料之外,他们宣布将跨入网络安全与量子运算领域。

不过,Nvidia在这两个新的应用所采取的做法,以及利基点,根据他们的发展策略来看,的确有其合理性──针对网络安全防护的应用场景,Nvidia将推出AI应用软件框架Morpheus(与电影黑客帝国人类反抗军领袖莫菲斯同名),提供优化的AI处理流程与预先完成训练的AI相关功能,能处理整个人信息料中心网络环境所有IP地址流量的检测作业;而在全世界都在关注的量子运算应用上,Nvidia将推出软件开发组件cuQuantum SDK,能运用GPU加速量子电路的模拟,让研究人员能够设计出更理想的量子计算机。

运用机器学习、人工智能技术来解决各行各业的资料分析难题,早已是当代企业IT的显学,信息安全当然也不例外,许多这领域的主要厂商与创业公司,都在积极发展相关的产品功能特色,或是后台的自动化资料分析与预测服务,然而,该如何妥善、快速构建具备高性能的AI安全应用基础架构,却往往被视为各家厂商的业务机密,而无法运用一套公用、标准的框架来进行规划与运维。

而在Nvidia即将推出的Morpheus应用软件框架其中,预计会提供一套具备AI加速能力的完整解决方案套餐,让网络安全厂商能够以此来侦测、预防所面临的各种安全威胁。

Morpheus是由哪些技术所组合而成?Nvidia透露,这是一套云计算原生的网络安全应用框架,其中采用了机器学习的技术,能够针对企业面临的安全威胁与异常行为,执行一套涵盖资料截取、识别(推论与验证) ,以及采取行动的流程,可协助处理难以识别的各种恶意活动,像是敏感资料外泄、网络钓鱼、恶意软件。

而这样的架构,会运用几个Nvidia本身,以及并购其他公司而得来的软硬件技术。

首先,是Nvidia自家的AI软件堆栈(云计算容器登录服务、GPU加速程序库),以及EGX平台(集成运算架构、通用GPU与I/O加速软件、单板计算机、GPU服务器),企业可运用上述环境,做到巨量网络安全资料的即时推论处理。而Morpheus在此采用的做法,类似于他们用于智慧城市与零售场景的应用软件框架Metropolis。

在Nvidia AI软件堆栈其中,Morpheus会依赖多种软件框架与服务器,像是资料科学分析框架RAPIDS,以及延伸的应用程序接口CLX(CyberLog Accelerators)、流媒体资料处理程序库cuStreamz,还有推论服务器Triton Inference Server,以及推论软件开发组件TensorRT。

其中的RAPIDS与cuStreamz,可加快资料注入、前处理,以及后处理;CLX包含网络安全专属的原型(primitives),这里将提供一些范例,让开发人员知道该如何训练新模型,以及准备训练的资料;Triton与TensorRT则负责推论处理,尤其是Triton,可支持动态与参差不齐的批处理作业。

除此之外,Morpheus在这里还会使用消息发布与订阅(pub/sub)的模式(Nivida现已改为Kafka),将资料发送至推论处理流程,以及从中回传结果。

对于未来使用的预先训练资料模型(pre-trained models),Nvidia也表示,Morpheus将集成MLFlow软件框架,能让用户在面对多种资料模型时,更容易去管理、更新与关注。

而在整个处理流程其中,即便这套架构提供的推论速度够快,Nvidia仍会持续调校资料模型,以便提高吞吐量,找出瓶颈、进行改善,并且产生机器学习训练的脚本,让大家都能组建自定的资料模型。

在资料吞吐量的性能上,Nvidia也公布他们的测试数据,单纯在PyTorch里面执行,推论速度是每秒40个,若改用Morpheus,则可达到每秒5019个,性能增长幅度达到125倍以上。

此外,在一开始使用Morpheus时,用户就能够直接配备多种预先训练模型(pre-trained models)。

第二个部分,则是源自于2020年4月并购Mellanox而来的BlueField DPU,主要的任务是以SmartNIC的身份来直接收取网络遥测资料。在DPU其中,可执行遥测代理程序,以便将相关资料引导至Morpheus。

结合这项技术之后,Morpheus能将网络环境其中的每一台运算节点,转换为提升网络防御力的边缘传感器,对于企业而言,能以最高连接速度来分析每一个封包,且不需为了分析而另行复制流量相关资料。

相较之下,若采用传统的AI安全工具,针对整体网络流量资料的采样分析比例,通常只能达到接近5%,而因为采用的资料模型不完整,将影响威胁侦测算法的成效。

在应用案例类型上,Morpheus可支持敏感资料外泄侦测、网络钓鱼侦测、异常行为剖析,这些可能都需要完整的封包资料分析,但资料流媒体的接收与处理都需要多次进行,而在Morpheus的框架之下,可以发起相关的动作,从网络接口(NIC)获得原始的推论处理结果,并且能做到持续、即时、可变化的反馈,将这些成果回送至网络接口,然后以此来修改管控政策、改写执行规则、调整敏感度。

关于资料进出Morpheus处理流程的部分,Nvidia表示,有种做法是在BlueField执行的遥测代理程序NetQ,而这套搭配的软件,出自Nvidia在2020年5月并购的Cumulus Networks。

基本上,若用户将代理程序安装、执行在交换机与服务器,NetQ接着就能收集整个网络的遥测资料,而在Morpheus的架构下,代理程序是执行在BlueField其中,之后将这些资料置入Kafka,再进行推论处理、收集结果。

在Nvidia发布Morpheus之际,他们也宣布多家厂商将在硬件、软件与网络安全解决方案其中,运用这套框架来调校与集成数据中心安全应用。在率先采用的企业案例上,消费电子零售商Best Buy也宣布导入的消息,他们表示,在持续不断变化的网络威胁态势下,对于异常行为与活动的侦测,要做到随需适应的程度,而Morpheus可提供一套具有弹性与扩展性的平台,让他们具备调适的能力,而在今年的GTC大会,他们也介绍自己如何运用Morpheus,像是:以自然语言处理的方式来解析事件记录(搭配cyBERT),侦测采用域名产生算法(Domain Generation Algorithm,DGA)的恶意网络活动,构建动态网络地图(Dynamic network map construction),以及异常侦测。

以网络安全厂商而言,有云计算安全企业Cloudflare,网站应用程序安全防护厂商F5,网络防火墙厂商Fortinet,以及安全创业公司Guardicore、ARIA Cybersecurity Solutions,目前已明确表态支持的企业,还包括:管理与信息科技顾问公司博思艾伦汉密尔顿控股(Booz Allen Hamilton),以及专攻事件记录分析与搜索的应用软件厂商Splunk。

而在混合云平台的部分,本身可基于Linux、OpenStack与Kubernetes等开原码软件而提供专属版本的Canonical、Red Hat,以及VMware,也都将在这方面应用与Nvidia展开合作。