-
-
[分享]输入一段文本即可生成视频,OpenAI即将推出新模型Sora
-
发表于:
2024-2-19 19:02
4716
-
[分享]输入一段文本即可生成视频,OpenAI即将推出新模型Sora
最近,科技圈又被人工智能领域一则消息刷屏——OpenAI公开宣布推出其新AI模型Sora。Sora是该公司继ChatGPT之后的又一个生成式人工智能模型,与ChatGPT聊天机器人不同的是,Sora可以直接根据用户提供的文本创建一段相对应的视频。
OpenAI的官网博客文章中写道:“该模型不仅理解用户在提示中要求的内容,还理解这些事物在现实世界中的存在方式。”
只要用户给定一个或简短或详细的描述,或者是提供一张静态图像,Sora就能够生成相对应的1080p清晰度的电影般场景。而且,Sora还能够扩展现有的视频片段,填补原视频缺失的细节。
Sora能够深度模拟真实物理世界的这一特性,在作为生产力工具方面具有很广阔的利用前景,例如,Sora能够理解“摄像机”的位置,这表明我们有可能仅需通过输入一段文字就可达到电影行业的摄像机操作员操作的效果。这无疑对媒体行业将是又一次的冲击。既有利于缩短视频的制作时间及成本,允许大众更自由地创建、实现想法,也对电影、电视和数字媒体从业人员的生计构成了威胁。
与此同时,不难想象,此工具一旦正式推出,网络上将涌现大量虚假视频,这对公众的鉴别能力也是一次考验。而针对Sora可能带来的一系列负面影响,OpenAI也有所准备,其表示正在与专家合作,探索该模型的漏洞,并创建工具来检测视频是否由Sora生成。
根据OpenAI研究人员共同撰写的题为《Video generation models as world simulators》的论文,Sora更像是一个“数据驱动的物理引擎”而不是一个创意工具。它不仅仅是单纯能够生成一段符合要求的视频,而是根据计算来确定环境中每个物体的物理特性。
在该篇论文的最后,OpenAI研究员总结道:“这些能力表明,视频模型的持续扩展是通向开发物理和数字世界以及其中的物体、动物和人类的高性能模拟器的一条有前途的道路。”
据OpenAI所称,其官网页面上所有展示出来的视频,全都是由Sora直接生成,未经任何二次修改。若是如此,可以看到这项技术目前虽然仍有一些瑕疵,但也已相当成熟,并且可以预见会随着训练集的增多、算法的改良而愈臻完善。
尽管在全球范围内对于Sora的反响都十分热烈,但OpenAI表示暂时还不会向公众推出此服务,因为在此之前,他们需要先对其采取一些安全措施。现在只有部分视觉艺术家、设计师和电影制作人得到了OpenAI授予的访问权限,以收集创意专业人士的使用反馈意见。目前,OpenAI正与红队成员(错误信息、仇恨内容和偏见等领域的专家)合作对抗性地测试该模型。
编辑:左右里
资讯来源:OpenAI、X
转载请注明出处和本文链接
[注意]传递专业知识、拓宽行业人脉——看雪讲师团队等你加入!