首页
限免课
实战课
免费好课
课程库
经验
问答
会员课程
首页 |经验 |影视后期 |经验详情

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

更新时间:2023-11-18

星元

影视后期

1586

PYoCo是另一种基于NVIDIA eDiffi模型的文本到视频扩散模型。PYoCo可以通过描述主角、动作和位置等来生成合成视频。该模型采用一种新颖的视频噪声先验技术,其通过文本生成的视频有更好的同步性和真实性,还能够生成各种不同风格如写实风或中国水墨风。

这个颠覆性的新模型,是几位研究人员在NVIDIA当实习生期间研究出来的。谁看了不得说一句“高手在民间”~

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

以下内容翻译整理自:https://research.nvidia.com/labs/dir/pyoco/,转载请注明出处。

来自NVIDIA、芝加哥大学和马里兰大学的一组研究人员推出了PYoCo,这是一种建立在eDiff-I基础上的大规模文本到视频扩散模型,而eDiff-I是一种尖端图像生成模型,另外一种新颖的视频噪声先验。

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

PYoCo可以通过描述主角、动作和位置等来生成合成视频。该模型还能够生成各种风格的视频(如写实或水墨风)。

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

据开发人员介绍,该模型结合了先前研究中的各种有效技术,例如时间注意力、联合图像-视频微调、级联生成架构和专家降噪器集成,在众多基准数据集上超越了其他方法。该团队分享的论文还强调了该模型实现高质量零镜头视频合成的能力,具有出色的照片真实感和时间一致性。

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

“我们提出了一种视频扩散噪声先验,用于微调文本到图像的扩散模型,用于文本到视频的合成,”该团队评论道。“我们表明,用这个先验微调文本到图像的扩散模型可以带来更好的知识转移和有效的训练。在小规模无条件生成基准上,我们实现了最新技术水平×更小的模型×更少的训练时间。且在零样本MSR-VTT评估中,我们的模型达到了9.73,这是目前最新、最先进的FID。”

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

视频生成模型利用人工智能技术来创建或编辑视频。它们可以生成、增强、转换、压缩视频。根据原理和特点,视频生成模型可以分为四类:基于GAN、基于VAE、基于AR、基于Diffusion。其中,基于Diffusion的模型PYoCo是,用先进的图像生成模型eDiff-I中的知识来提高训练效率,同时结合时间注意力、联合图像视频微调、级联生成架构和去噪专家集成等技术,在无条件和零样本视频生成方面具有显著优势。

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

作为一种基于文本的视频生成模型,PYoCo可广泛应用于内容创作、教育培训、娱乐媒体和医疗诊断等领域。这一模型可以根据用户的需求和兴趣生成各种风格和主题的视频,为各行各业提供便捷、灵活、有效、有趣的解决方案。

NVIDIA推出文本转视频模型PYoCo,稳定性更好、训练更简单!居然是实习生搞出来的

版权声明 | 文章整理自网络,仅供学习参考,版权归属原作所有

                如有问题,请及时与我们联系,我们将第一时间做出处理

上一篇 下一篇

相关课程

ONLINE COURSES
  • AE 如何制作摆动变化文字

    AE 如何制作摆动变化文字

    讲师:超能冲击波

  • ae 视频编码插件

    ae 视频编码插件

    讲师:爱剪辑的尤尤

  • ae渐变擦除

    ae渐变擦除

    讲师:爱剪辑的尤尤

  • AE 内置插件 Ball action

    AE 内置插件 Ball action

    讲师:爱剪辑的尤尤

免费好课

FREE GOOD COURSES
MORE
  • 剪映和PR的短视频剪辑技巧

    剪映和PR的短视频剪辑技巧

    3小时22分钟26秒

  • Stable Diffusion - 2024全新AI绘画系统教学

    Stable Diffusion - 2024全新AI绘画系统教学

    1小时40分钟49秒

  • UE5游戏开发黑科技-四大So Easy插件,从菜鸟到大师仅一步之遥!

    UE5游戏开发黑科技-四大So Easy插件,从菜鸟到大师仅一步之遥!

    37分钟30秒

  • AE软件入门基础课

    AE软件入门基础课

    3小时48分钟27秒

  • PS海报创意设计课

    PS海报创意设计课

    4小时55分钟26秒

  • Q版角色三头身设计课

    Q版角色三头身设计课

    3小时9分钟29秒

Copyright © 2015 - 2021北京云创科讯软件有限公司

京ICP备16013396号-1

经营许可证京ICP证161220号

课程咨询电话 18516802937

  • 在线咨询
  • 插件下载
  • 职业测评
  • 素材下载
  • 微信咨询
学习在线解答