发布时间:2024-12-24 15:28:04 来源: sp20241224
中新网 北京2月22日电(记者 袁秀月)“给它读一遍《三国演义》试试”“《三体》可以直接小说转电影了”……近日OpenAI发布首个文生视频模型Sora,在网上迅速刷屏,不少网友跃跃欲试,期待将来用AI还原小说中的场景。
还有人预测,以后人人都能拍出自己满意的影视剧了。将来这会实现吗?或者说,离实现这点还有多远?
截图自Sora生成视频把小说输进AI,然后呢?
在谈论Sora之前,不得不提到,当前很多影视游戏行业人士已经将AIGC(人工智能生成内容)应用于内容制作上。
来自四川的博主冯先生(“AI疯人院”)在CG领域工作了15年,从事过影视特效后期、游戏研发等。他表示,现在影视行业正广泛接纳AI的进入,目前主要应用于影视前期的概念设计、舞台设计等,一些动画团队、游戏开发公司也正布局或引入AI生产线。
冯先生最近在短视频平台发布了多条《西游记》系列AI概念动画,获得了近百万的播放量。他告诉记者,他使用的工具是AI绘画工具Midjourney和AI视频生成工具Runway。
“每个镜头要先构思好,然后通过Midjourney画出画面,一个镜头可能要画上千张,最后选出一张,‘猴王问世’那集我画了三四千张,最后选出一百个左右镜头,再把这些镜头拿给AI工具生成动画,然后进行剪辑。台词先设计好,用AI配音来配,有些特殊的我会自己配音,再用变声器调整效果。”
冯先生说,用AI制作这样一段视频需花费一周左右,但若人工制作可能需要几个月。他表示,一般做动画,需要概念设计、原画、2D逐帧分镜、3D场景搭建等流程,但如果有AI辅助的话,只需有原画,AI就会帮你出画面并生成动画效果,中间过程会省去很多。
而Sora的问世或将这个过程省去更多。在冯先生看来,Sora能够在一个画面里生成多个镜头,这是他以往使用的工具做不到的,这也就意味着将来能创作出更流畅、完整的作品。
截图自Sora生成视频那么,把小说输进去,能得到满意的视频吗?冯先生认为,还需要一个过程,快的话可能等个三四年。“其实技术上的都不是难题,难在人类能够理解各个不同国家的文学作品,了解它的背景和不同的文化元素,但AI还没有很好理解这些东西。”
冯先生提到,在他用AI工具创作的过程中,能够明显感觉到它对不同文化的了解并不透彻,比如说中国文化,看起来风格相像,但仔细看衣服的纹饰和盔甲的造型并不真实存在。
不过他也表示,AI的学习是呈指数级增长的,从画面抽象到能理解画面的丰富性和风格,仅迭代了一年多时间。Sora确实存在瑕疵,但这只是AI的迭代过程,在未来不是什么大事。
截图自Sora生成视频Sora问世,人人成为导演?
虽然目前Sora还未对公众开放,但不少人认为其意义不亚于1年前ChatGPT的发布。从技术角度来讲,Sora强在哪里?
北京师范大学教育学部副教授张进宝表示,Sora采用了扩散模型和Transformer架构的结合(Diffusion Transformers, DiTs)。扩散模型通过逐渐添加噪声来破坏图像,然后学习逆向过程来恢复图像。Transformer架构则可以捕捉图像中的全局依赖关系。
Sora的生成过程可以分为以下几个步骤:将文本描述转换为一系列的语义向量;将语义向量输入到模型中,生成视频的潜在表示;将潜在表示解码为像素,生成最终的视频。
张进宝说,目前我们看到的是Sora使用了大量的视频和图像数据集进行训练,包括电影、电视剧、纪录片、游戏画面等。这些数据集涵盖了各种场景、人物和动作,为模型提供了丰富的学习素材。
在他看来,Sora的诞生不仅标志着视频生成技术的重大进步,也为内容创作、媒体、娱乐等行业带来了前所未有的机遇和挑战。例如:Sora的出现预示着视频生成领域的竞争将变得更为激烈,推动多模态AI以及各种AI应用场景的快速发展,特别是在需要真实世界建模的行业。与传统的影视制作相比,使用Sora的生产过程更简单,投资成本更低,创意结果更快速。
张进宝认为,Sora让创作者可以更自由地使用AI工具表达自己的想法,减少了工业流程的约束,为内容创作提供了新的视角和工具。虽然目前Sora还无法完全取代传统的影视制作,但其强大的能力表明,依靠AI辅助人类创造力的方向越来越明确,这可能会重新定义影视内容的创作和消费方式。
截图自Sora生成视频“这也是AI引起那么多讨论的原因之一,会给大家带来压力,其实我身边的从业者基本没受到影响,如果你是一个成熟有经验的美术或特效,并不会受到太大影响,它会成为你的一个辅助工具。”冯先生认为,即便有AI,人人成为导演也不现实,最后还是掌握在少数专业人的手里。
中国影协科幻电影工作委员会执行秘书长马贺亮在接受媒体采访时也表示,短期内与概念设计、视频预览相关的岗位会在一定程度上受到Sora的影响,但它所能呈现的效果其实还达不到院线电影的级别,而且电影在创作上有主观立场、视角和表达,观看时有情感交流和情感投射,远不是简单生成一段视频就能代替,因此AI作为技术辅助手段的确已经在改变电影制作方式与流程,能优化提升电影创作,但要说它能“颠覆整个电影行业”,还为时过早。
截图自Sora生成视频AI还有哪些可能性?
“潘多拉的盒子既然已经打开,指望它关上太不现实了。”在冯先生看来,除了绘画、做视频、文案等,AI还有更大的发展空间。
“Sora模型所展示出的能力,可以让人们进一步畅想更多的应用可能,为各个领域带来新的变革和创新。”张进宝举例,比如在教育领域中,可用于制作个性化的教学视频,模拟实验和场景,用于创建虚拟课堂,提供更加便捷的教育资源。
在医疗领域,可用于制作医学动画,帮助医生和患者更好地理解病情;模拟手术过程,帮助医生进行术前规划和训练;进行远程医疗,为偏远地区患者提供便捷的医疗服务。在科研领域,可用于模拟科学实验,生成科学数据可视化,构建虚拟世界,用于科学研究和探索。在商业领域,可用于制作产品宣传视频、创建虚拟展厅,用于市场调查和分析,帮助企业更好地了解客户需求,等等。
截图自Sora生成视频与此同时,Sora可能带来的风险也备受关注,比如可能被用于造假或欺骗,Sora生成的内容可能存在偏见或错误,等等。法律界人士认为,随着AI技术的发展,法律上的监管也需要跟上。服务者或提供者在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,也需要采取有效措施防止产生各类歧视,同时避免制作、复制、发布、传播虚假信息。
在张进宝看来,智能化将全面渗透人类社会,人们将在广泛使用各类智能技术提升竞争力与完成任务的过程中,学会理解技术、捕捉新兴技术的潜力,推动社会有秩序的动态发展。“捕捉科技发展新动态,在可控范围内做出正确的决策,考验的不仅仅是一个人,而是整个社会的应变能力。”(完)
【编辑:钱姣姣】