谷歌宣布开发基于人工智能的下一代文本到视频生成器Lumiere
谷歌研究院的一组人工智能研究人员开发了下一代基于人工智能的文本到视频生成器Lumiere。该小组发表了一篇论文,描述了他们在arXiv预印本服务器上的努力。
在过去的几年里,人工智能应用程序已经从研究实验室转移到大型用户社区,例如,像ChatGPT这样的法学硕士已经与浏览器集成,允许用户以前所未有的方式生成文本。
最近,文本到图像生成器允许用户创建超现实的图像。文本到视频生成器允许用户只使用几个单词就可以生成短视频剪辑。在这一新的努力中,谷歌的团队将最后一个类别带到了一个新的高度,他们宣布了一个名为Lumiere的文本到视频生成器。
Lumiere,可能是以开创早期摄影设备的Lumiere兄弟命名的,允许用户输入一个简单的句子,比如“两只浣熊在一起读书”,然后返回一个完整的视频,显示两只浣熊在一起读书,而且它的分辨率高得惊人。新的生成器通过创建更好看的结果,代表了文本到视频生成器发展的下一步。
谷歌将新发电机背后的技术描述为“开创性的时空U-Net架构”。它被设计成在一个单一的模型中生成动画视频。
演示视频显示,谷歌增加了额外的功能,比如允许用户通过突出显示视频的一部分并输入指令来编辑现有视频,比如“将衣服颜色改为红色”。生成器还生成不同类型的结果,例如样式化,其中创建主题的样式,而不是全彩色表示。它还允许子样式,例如不同的样式引用。它也有cinemagrapics,用户可以突出显示静止图像的部分或全部,并将其动画化。
在声明中,谷歌没有具体说明他们是否计划向公众发布或分发Lumiere,这可能是由于潜在的违反版权法的视频创作可能产生的明显的法律后果。
更多信息:Omer Bar-Tal等,Lumiere:一种视频生成的时空扩散模型,中文信息学报,(2024)。DOI: 10.48550 / arxiv.2401.12945
lumiere-video.github.io /
期刊信息:
arXiv
?2024 Science X Network
引用谷歌宣布开发人工智能名片Lumiere
sed下一代文本到视频生成器(2024年1月26日)于2024年1月26日从https://techxplore.com/news/2024-01-google-lumiere-ai-ba检索
html本文档
作品受版权保护。除为私人学习或研究目的而进行的任何公平交易外,未经书面许可,不得转载任何部分。的有限公司
内容仅供参考之用。
相关文章
发表评论