跨入AI安全领域，Nvidia推出专属应用框架Morpheus

经过多年以来的发展，GPU大厂Nvidia已陆续发展出多种针对不同产业与场景的应用软件框架，像是：Clara是用于医疗看护，Isaac是用于制造业机器人与自动化，Metropolis是用于智慧城市，Aerial用于5G通信，Maxine用于视频会议服务；有些应用软件框架可以支持多种产业，像是支持对话式AI的Jarvis，以及提供推荐系统功能的Merlin，能用于零售业与电子商务。

而在今年4月举行的GTC大会期间，Nvidia除了继续强化上述应用软件框架，出乎众人意料之外，他们宣布将跨入网络安全与量子运算领域。

不过，Nvidia在这两个新的应用所采取的做法，以及利基点，根据他们的发展策略来看，的确有其合理性──针对网络安全防护的应用场景，Nvidia将推出AI应用软件框架Morpheus（与电影黑客帝国人类反抗军领袖莫菲斯同名），提供优化的AI处理流程与预先完成训练的AI相关功能，能处理整个人信息料中心网络环境所有IP地址流量的检测作业；而在全世界都在关注的量子运算应用上，Nvidia将推出软件开发组件cuQuantum SDK，能运用GPU加速量子电路的模拟，让研究人员能够设计出更理想的量子计算机。

运用机器学习、人工智能技术来解决各行各业的资料分析难题，早已是当代企业IT的显学，信息安全当然也不例外，许多这领域的主要厂商与创业公司，都在积极发展相关的产品功能特色，或是后台的自动化资料分析与预测服务，然而，该如何妥善、快速构建具备高性能的AI安全应用基础架构，却往往被视为各家厂商的业务机密，而无法运用一套公用、标准的框架来进行规划与运维。

而在Nvidia即将推出的Morpheus应用软件框架其中，预计会提供一套具备AI加速能力的完整解决方案套餐，让网络安全厂商能够以此来侦测、预防所面临的各种安全威胁。

Morpheus是由哪些技术所组合而成？Nvidia透露，这是一套云计算原生的网络安全应用框架，其中采用了机器学习的技术，能够针对企业面临的安全威胁与异常行为，执行一套涵盖资料截取、识别（推论与验证），以及采取行动的流程，可协助处理难以识别的各种恶意活动，像是敏感资料外泄、网络钓鱼、恶意软件。

而这样的架构，会运用几个Nvidia本身，以及并购其他公司而得来的软硬件技术。

首先，是Nvidia自家的AI软件堆栈（云计算容器登录服务、GPU加速程序库），以及EGX平台（集成运算架构、通用GPU与I/O加速软件、单板计算机、GPU服务器），企业可运用上述环境，做到巨量网络安全资料的即时推论处理。而Morpheus在此采用的做法，类似于他们用于智慧城市与零售场景的应用软件框架Metropolis。

在Nvidia AI软件堆栈其中，Morpheus会依赖多种软件框架与服务器，像是资料科学分析框架RAPIDS，以及延伸的应用程序接口CLX（CyberLog Accelerators）、流媒体资料处理程序库cuStreamz，还有推论服务器Triton Inference Server，以及推论软件开发组件TensorRT。

其中的RAPIDS与cuStreamz，可加快资料注入、前处理，以及后处理；CLX包含网络安全专属的原型（primitives），这里将提供一些范例，让开发人员知道该如何训练新模型，以及准备训练的资料；Triton与TensorRT则负责推论处理，尤其是Triton，可支持动态与参差不齐的批处理作业。

除此之外，Morpheus在这里还会使用消息发布与订阅（pub/sub）的模式（Nivida现已改为Kafka），将资料发送至推论处理流程，以及从中回传结果。

对于未来使用的预先训练资料模型（pre-trained models），Nvidia也表示，Morpheus将集成MLFlow软件框架，能让用户在面对多种资料模型时，更容易去管理、更新与关注。

而在整个处理流程其中，即便这套架构提供的推论速度够快，Nvidia仍会持续调校资料模型，以便提高吞吐量，找出瓶颈、进行改善，并且产生机器学习训练的脚本，让大家都能组建自定的资料模型。

在资料吞吐量的性能上，Nvidia也公布他们的测试数据，单纯在PyTorch里面执行，推论速度是每秒40个，若改用Morpheus，则可达到每秒5019个，性能增长幅度达到125倍以上。

此外，在一开始使用Morpheus时，用户就能够直接配备多种预先训练模型（pre-trained models）。

第二个部分，则是源自于2020年4月并购Mellanox而来的BlueField DPU，主要的任务是以SmartNIC的身份来直接收取网络遥测资料。在DPU其中，可执行遥测代理程序，以便将相关资料引导至Morpheus。

结合这项技术之后，Morpheus能将网络环境其中的每一台运算节点，转换为提升网络防御力的边缘传感器，对于企业而言，能以最高连接速度来分析每一个封包，且不需为了分析而另行复制流量相关资料。

相较之下，若采用传统的AI安全工具，针对整体网络流量资料的采样分析比例，通常只能达到接近5%，而因为采用的资料模型不完整，将影响威胁侦测算法的成效。

在应用案例类型上，Morpheus可支持敏感资料外泄侦测、网络钓鱼侦测、异常行为剖析，这些可能都需要完整的封包资料分析，但资料流媒体的接收与处理都需要多次进行，而在Morpheus的框架之下，可以发起相关的动作，从网络接口（NIC）获得原始的推论处理结果，并且能做到持续、即时、可变化的反馈，将这些成果回送至网络接口，然后以此来修改管控政策、改写执行规则、调整敏感度。

关于资料进出Morpheus处理流程的部分，Nvidia表示，有种做法是在BlueField执行的遥测代理程序NetQ，而这套搭配的软件，出自Nvidia在2020年5月并购的Cumulus Networks。

基本上，若用户将代理程序安装、执行在交换机与服务器，NetQ接着就能收集整个网络的遥测资料，而在Morpheus的架构下，代理程序是执行在BlueField其中，之后将这些资料置入Kafka，再进行推论处理、收集结果。

在Nvidia发布Morpheus之际，他们也宣布多家厂商将在硬件、软件与网络安全解决方案其中，运用这套框架来调校与集成数据中心安全应用。在率先采用的企业案例上，消费电子零售商Best Buy也宣布导入的消息，他们表示，在持续不断变化的网络威胁态势下，对于异常行为与活动的侦测，要做到随需适应的程度，而Morpheus可提供一套具有弹性与扩展性的平台，让他们具备调适的能力，而在今年的GTC大会，他们也介绍自己如何运用Morpheus，像是：以自然语言处理的方式来解析事件记录（搭配cyBERT），侦测采用域名产生算法（Domain Generation Algorithm，DGA）的恶意网络活动，构建动态网络地图（Dynamic network map construction），以及异常侦测。

以网络安全厂商而言，有云计算安全企业Cloudflare，网站应用程序安全防护厂商F5，网络防火墙厂商Fortinet，以及安全创业公司Guardicore、ARIA Cybersecurity Solutions，目前已明确表态支持的企业，还包括：管理与信息科技顾问公司博思艾伦汉密尔顿控股（Booz Allen Hamilton），以及专攻事件记录分析与搜索的应用软件厂商Splunk。

而在混合云平台的部分，本身可基于Linux、OpenStack与Kubernetes等开原码软件而提供专属版本的Canonical、Red Hat，以及VMware，也都将在这方面应用与Nvidia展开合作。