输入文本就能画出心中美景,NVIDIA展示GauGAN2的AI绘画能力

GPU大厂英伟达 (NVIDIA) 今日宣布,借着NVIDIA Research广受欢迎的AI人工智能绘画展示的最新版GauGAN2协助,现在只需输入三、四个字,一样能通过强大算力,让计算机画出逼真画面。

英伟达指出,GauGAN背后的深度学习模型让大家将想象力化为逼真的作品,比过去更容易,只需输入“sunset at a beach”等短句,人工智能便会即时生成场景。再加入形容词如“sunset at a rocky beach”,或将“sunset”换成“afternoon”、“rainy day”,以生成对抗网络为基础的模型还可立即修改。

不仅如此,用户只需按个按钮,便能产生分割图,在高层次轮廓图显示场景中物体位置。用户可切换到绘图画面,用天空、树木、岩石和河流等标签,通过粗略草图调整场景,用智能笔刷将涂鸦融入图片。

英伟达展示有趣画面,使GauGAN2将分割映射 (segmentation mapping)、图像修复及文本到图片生成等技术融合到一个模型,成为强大的工具,混合使用文本和绘画创造极写实的艺术作品。借由结合文本、语义分割、草图和风格样式等多种模式──GAN框架示范内容,艺术家更轻松将脑海中想法变成高品质的AI人工智能图片。

用户无需画出想象场景的每个元素,只需输入短句,便能快速产生关键特征和主题,像是白雪皑皑的山脉,接着可于起点草草几笔,让某座山更高;前景加入几棵树,或天空增加几朵云。不仅能创作十分写实的图片,艺术家还能描绘出超凡脱俗的景色。

想象一下,若想重现《星球大战》(Star Wars) 系列有两个太阳的Tatooine星球,用户只要输入“desert hills sun”就能创建起点,接着快速画出第二个太阳的草图。用户只要在文本方块输入更多字,就会在AI创造图片加入更多内容。

英伟达强调,NVIDIA Selene超级计算机已使用1千万张高品质风景图片训练GauGAN2 AI模型。NVIDIA Selene超级计算机采用NVIDIA DGX SuperPOD系统,是全球前十名超级计算机之一。研究人员使用神经网络学习单词及对应的视觉内容关系,如“winter”、“foggy”或“rainbow”。与专用于文本到图片,或分割图到图片之应用程序最先进模型相比,GauGAN2的神经网络产生种类更丰富、更高品质的图片。

GauGAN2展示内容显现艺术家日后使用强大图片生成工具创作的无限可能性。例子之一即基于GauGAN技术的NVIDIA Canvas应用程序,NVIDIA RTX GPU用户皆能下载。

(首图来源:英伟达)