有人曾说「一图胜千言」,不过现在只需输入三到四个字,即可画出逼真的画面。这都要拜NVIDIA Research 广受欢迎的AI绘画演示的最新版本GauGAN2 之赐。
GauGAN背后的深度学习模型让大家将脑中的想象力,转化成逼真的作品,且比过去更容易。只需输入像是「sunset at a beach」一个简短的句子,AI 便会即时生成这个场景。再加入一个形容词如「sunset at a rocky beach」,或将「sunset」换成「afternoon」或「rainy day」,这个以生成对抗网络为基础的模型就会立即修改画面。
使用者只需按下一个按钮,便能生出一个分割图,在这个高层次轮廓图内显示了场景中的物体位置。接着使用者可以切换到绘图的画面,用天空、树木、岩石和河流等标签,透过粗略的草图来调整场景,让笔刷将这些涂鸦融入绝美的影像中。
现在可以在 NVIDIA AI Demos 网站体验全新的GauGAN2文字转影像功能,使用者可以透过NVIDIA Research提供的最新演示内容,体验AI的强大威力。而GauGAN2 提供多种文字提示及草图功能,使用者能够更快速地建立及自订场景,并控制细微之处。
简单几个字,便能生成精美影像的人工智能
GauGAN2将分割映射(segmentation mapping)、图像修复及文字到影像生成等技术融合在一个模型里,使其成为一个强大的工具,可以混合使用文字和绘画创造极为写实的艺术作品。该演示是首批将文字、语义分割、草图和风格样式等多种模式,结合在单一GAN框架內的演示內容之一。如此一来艺术家们便能更轻易地将脑袋中的想法变成高质量的 AI 生成影像。
使用者无需画出想像场景的每个元素,只需输入一个简短的句子,便能快速产生出影像的关键特征和主题,比如白雪皑皑的山脉。接着可以自行在这个起点上草草画下几笔,比如让某一座山变得更高、在前景里加入几棵树,又或是在天空中加入几朵云。该演示不仅能创作出十分写实的影像,艺术家们还能借此描绘超凡脱俗的景色。举例来说,在脑袋中想像一下,重现《星际大战》系列中有着两个太阳的Tatooine 星球。使用者只要输入「desert hills sun」的文字,就能建立一个起点,接着使用者可以快速画出第二个太阳的草图。
使用者反复在文字方块中输入的每一个字,都会在这个AI 创造的影像中加入更多内容。NVIDIA 在NVIDIA Selene 超级电脑上,使用一千万张高品质风景图片来训练GauGAN2 背后的AI模型,NVIDIA Selene超级电脑采用NVIDIA DGX SuperPOD 系统,是全球最强大的十台超级电脑之一。研究人员使用一个神经网络来学习单字及其所对应的视觉内容间的关系,例如「winter」、「foggy」或「rainbow」。与专用于文字到影像,或是分割图到影像之应用程式最先进的模型相比,GauGAN2 背后的神经网路产生出种类更丰富、更高品质的影像。
GauGAN2 研究演示内容展示出艺术家日后使用强大的影像生成工具,进行创作的无限可能性。其中的一个例子即是基于GauGAN 技术的NVIDIA Canvas应用程式,NVIDIA RTX GPU的用户皆能下载。NVIDIA Research于全球拥有200多名科学家,专注于包括AI、电脑视觉、自动驾驶车、机器人和绘图等领域。我们进一步期待他们的研究成果吧~
版权声明 | 文章配图仅供学习参考,引用图片版权归属原作所有
如有问题,请及时与我们联系,我们将第一时间做出处理