加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

谷歌AI制成视频两连发 720p高清+长镜头

发布时间:2022-10-13 03:30:03 所属栏目:外闻 来源:网络
导读:   Meta发布 「用嘴做视频」 仅一周,谷歌CEO劈柴哥接连派出 两名选手上场竞争。



  Imagen Video同样基于最近大火的扩散模型,直接继承自5月份的图像生成SOTA模型Imagen。

  Meta发布 「用嘴做视频」 仅一周,谷歌CEO劈柴哥接连派出 两名选手上场竞争。
 
  Imagen Video同样基于最近大火的扩散模型,直接继承自5月份的图像生成SOTA模型Imagen。
 
  除了分辨率高以外,还展示出三种特别能力。
 
  首先它能理解并生成不同艺术风格的作品,如“水彩画”或者“像素画”,或者直接“梵高风格”。
 
  除了应用效果出色以外,研究人员表示其中用到的一些优化技巧不光对视频生成有效,可以泛化至一般扩散模型。
 
  具体来说,Imagen Video是一系列模型的集合。
 
  语言模型部分是谷歌自家的 T5-XXL,训练好后冻结住文本编码器部分。
 
  与负责从文本特征映射到图像特征的CLIP相比,有一个关键不同:
 
  语言模型只负责编码文本特征,把文本到图像转换的工作丢给了后面的视频扩散模型。
 
  基础模型,在生成图像的基础上以自回归方式不断预测下一帧,首先生成一个48*24、每秒3帧的视频。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!