输入文本就能画出心中美景，NVIDIA展示GauGAN2的AI绘画能力

GPU大厂英伟达 (NVIDIA) 今日宣布，借着NVIDIA Research广受欢迎的AI人工智能绘画展示的最新版GauGAN2协助，现在只需输入三、四个字，一样能通过强大算力，让计算机画出逼真画面。

英伟达指出，GauGAN背后的深度学习模型让大家将想象力化为逼真的作品，比过去更容易，只需输入“sunset at a beach”等短句，人工智能便会即时生成场景。再加入形容词如“sunset at a rocky beach”，或将“sunset”换成“afternoon”、“rainy day”，以生成对抗网络为基础的模型还可立即修改。

不仅如此，用户只需按个按钮，便能产生分割图，在高层次轮廓图显示场景中物体位置。用户可切换到绘图画面，用天空、树木、岩石和河流等标签，通过粗略草图调整场景，用智能笔刷将涂鸦融入图片。

英伟达展示有趣画面，使GauGAN2将分割映射 (segmentation mapping)、图像修复及文本到图片生成等技术融合到一个模型，成为强大的工具，混合使用文本和绘画创造极写实的艺术作品。借由结合文本、语义分割、草图和风格样式等多种模式──GAN框架示范内容，艺术家更轻松将脑海中想法变成高品质的AI人工智能图片。

用户无需画出想象场景的每个元素，只需输入短句，便能快速产生关键特征和主题，像是白雪皑皑的山脉，接着可于起点草草几笔，让某座山更高；前景加入几棵树，或天空增加几朵云。不仅能创作十分写实的图片，艺术家还能描绘出超凡脱俗的景色。

想象一下，若想重现《星球大战》(Star Wars) 系列有两个太阳的Tatooine星球，用户只要输入“desert hills sun”就能创建起点，接着快速画出第二个太阳的草图。用户只要在文本方块输入更多字，就会在AI创造图片加入更多内容。

英伟达强调，NVIDIA Selene超级计算机已使用1千万张高品质风景图片训练GauGAN2 AI模型。NVIDIA Selene超级计算机采用NVIDIA DGX SuperPOD系统，是全球前十名超级计算机之一。研究人员使用神经网络学习单词及对应的视觉内容关系，如“winter”、“foggy”或“rainbow”。与专用于文本到图片，或分割图到图片之应用程序最先进模型相比，GauGAN2的神经网络产生种类更丰富、更高品质的图片。

GauGAN2展示内容显现艺术家日后使用强大图片生成工具创作的无限可能性。例子之一即基于GauGAN技术的NVIDIA Canvas应用程序，NVIDIA RTX GPU用户皆能下载。

(首图来源：英伟达)