主页 > [db:分类ID] > 开年大模型再出“王炸” 短视频行业将被AI颠覆吗?

开年大模型再出“王炸” 短视频行业将被AI颠覆吗?

imtoken官网下载 [db:分类ID] 2024-02-22 18:41

相似的时间点,更甚于上次的震撼。2月16日,曾以大模型ChatGPT震惊全球的人工智能科技公司OpenAI再次祭出新王炸——文生视频大模型Sora,只需输入一段文本指令,即可生成一段60秒的视频,画面精致细腻。

AI(人工智能)成长速度比想象中更快!有人对此振奋,也有人表达担忧:人类是否真的准备好了?但越来越多的声音认为,人工智能将引领第四次工业革命。

首个视频大模型横空出世

Sora并非首个文生视频大模型。此前,科技巨头谷歌、创业公司Runway等都已布局这一赛道。Sora何以惊艳全球?相比此前应用,它将生成视频的时间大幅延长至60秒,在画面的细致逼真、流畅程度、三维空间多角度呈现等方面也有明显提升。

360集团创始人周鸿祎就谈到了几个让他印象深刻的镜头:小狗在雪地玩耍溅起纷飞的雪粒,毛茸茸的毛发根根分明、随风浮动;咖啡杯里,两只帆船缠斗掀起翻涌的波浪水纹;不同角度的街景通过运镜流畅地呈现。

跳出视频领域,更深广的变革或许正悄然发生。

周鸿祎谈到,Sora的颠覆性绝不仅仅限于一个文字生成视频的工具,而是通用人工智能对世界理解的又一次突破。一年前,ChatGPT标志着人工智能对人类语言和知识的理解达到了一个突破点。而除此之外,这个世界还有很多规律,例如小狗拱雪雪会留在鼻子上、无人机在空中飞时视角如何变换等,而Sora目前生成的视频,显示它对这个世界的规律有了更为完整的理解。这意味着,通用人工智能时代或将加速到来。

同济大学人文学院特聘教授解学芳也认为,Sora的出现意味着AI理解真实世界的能力进一步跃升,但这类大模型的突破性发展未来也会受到算力、算法、伦理法规的制约,应对其保持积极且审慎的态度。

视频行业格局或被重塑

Sora的横空出世,让视频领域从业者感受到了危机。太震撼,感觉要丢饭碗了。北京某文化传播有限公司创始人胡娟坦言,Sora让她危机感陡增,这完全可以用于镜头样板,一些复杂的特效制作,以前工期至少得好几天,但AI将其缩短到了几分钟。

摄影师李浩楠认为,Sora对影视相关的产业影响比较大,能大幅拉低制作成本,特别是涉及多角度、多机位的视频,如果AI能够部分替代人工拍摄和剪辑,成本可能只要原来的十分之一。

Sora的技术突破也让大大小小生成式AI创业公司和投资机构的前景变得充满挑战。某专注全球早中期企业的风投公司运营合伙人罗超表示,Sora表现出的领先性让Runway、Pika Labs等视频生成大模型明星公司面临强力冲击,而相比这些自研大模型公司,纯做应用的创业公司则更加前途未卜。

在新壹科技CEO雷涛看来,Sora的诞生,无疑会改变AI视频生成市场格局。就国内而言,要看哪些企业能结合、利用新技术,完善符合国情的产品。

AI让眼见不一定为实

Sora展示的生成视频也被发现有不少穿帮镜头。比如,在一段老奶奶吹蜡烛的视频中,老奶奶吹气后蜡烛却没有熄灭;在另一段玻璃杯从空中坠落的视频中,玻璃杯刚被抬到半空,桌上就已经有水流出来了。

这也是目前文生视频大模型的短板——不懂物理世界以及因果关系等。在中国政法大学传播法研究中心副主任朱巍看来,大模型所生成的视频代表着AI对这个世界规律的理解,但这不一定都是正确的,因此也让眼见不一定为实。

更广泛的担忧,是视频的可信度高于文字和图片,一旦生成门槛被大幅降低,难辨真伪的虚假视频可能会被用于传播谣言、诈骗等非法领域。对此,朱巍认为,应参考此前针对生成式AI的相关规定,对AI生成内容予以标识。

此外,创作者用一段文字生成视频后,该视频的版权归属等问题也需要重新梳理。目前,针对AI生成文字或图片的著作权归属问题已形成争论。去年年底,北京互联网法院就针对一起人工智能生成图著作权侵权纠纷案做出一审判决,这也是我们首例涉及AI文生图著作权案件。法官认为,人们利用生成式人工智能生成图片时,本质上仍然是人利用工具进行创作,如果能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法的保护。

相似的时间点,更甚于上次的震撼。2月16日,曾以大模型ChatGPT震惊全球的人工智能科技公司OpenAI再次祭出新王炸——文生视频大模型Sora,只需输入一段文本指令,即可生成一段60秒的视频,画面精致细腻。

AI(人工智能)成长速度比想象中更快!有人对此振奋,也有人表达担忧:人类是否真的准备好了?但越来越多的声音认为,人工智能将引领第四次工业革命。

首个视频大模型横空出世

Sora并非首个文生视频大模型。此前,科技巨头谷歌、创业公司Runway等都已布局这一赛道。Sora何以惊艳全球?相比此前应用,它将生成视频的时间大幅延长至60秒,在画面的细致逼真、流畅程度、三维空间多角度呈现等方面也有明显提升。

360集团创始人周鸿祎就谈到了几个让他印象深刻的镜头:小狗在雪地玩耍溅起纷飞的雪粒,毛茸茸的毛发根根分明、随风浮动;咖啡杯里,两只帆船缠斗掀起翻涌的波浪水纹;不同角度的街景通过运镜流畅地呈现。

跳出视频领域,更深广的变革或许正悄然发生。

周鸿祎谈到,Sora的颠覆性绝不仅仅限于一个文字生成视频的工具,而是通用人工智能对世界理解的又一次突破。一年前,ChatGPT标志着人工智能对人类语言和知识的理解达到了一个突破点。而除此之外,这个世界还有很多规律,例如小狗拱雪雪会留在鼻子上、无人机在空中飞时视角如何变换等,而Sora目前生成的视频,显示它对这个世界的规律有了更为完整的理解。这意味着,通用人工智能时代或将加速到来。

同济大学人文学院特聘教授解学芳也认为,Sora的出现意味着AI理解真实世界的能力进一步跃升,但这类大模型的突破性发展未来也会受到算力、算法、伦理法规的制约,应对其保持积极且审慎的态度。

视频行业格局或被重塑

Sora的横空出世,让视频领域从业者感受到了危机。太震撼,感觉要丢饭碗了。北京某文化传播有限公司创始人胡娟坦言,Sora让她危机感陡增,这完全可以用于镜头样板,一些复杂的特效制作,以前工期至少得好几天,但AI将其缩短到了几分钟。

摄影师李浩楠认为,Sora对影视相关的产业影响比较大,能大幅拉低制作成本,特别是涉及多角度、多机位的视频,如果AI能够部分替代人工拍摄和剪辑,成本可能只要原来的十分之一。

Sora的技术突破也让大大小小生成式AI创业公司和投资机构的前景变得充满挑战。某专注全球早中期企业的风投公司运营合伙人罗超表示,Sora表现出的领先性让Runway、Pika Labs等视频生成大模型明星公司面临强力冲击,而相比这些自研大模型公司,纯做应用的创业公司则更加前途未卜。

在新壹科技CEO雷涛看来,Sora的诞生,无疑会改变AI视频生成市场格局。就国内而言,要看哪些企业能结合、利用新技术,完善符合国情的产品。

AI让眼见不一定为实

Sora展示的生成视频也被发现有不少穿帮镜头。比如,在一段老奶奶吹蜡烛的视频中,老奶奶吹气后蜡烛却没有熄灭;在另一段玻璃杯从空中坠落的视频中,玻璃杯刚被抬到半空,桌上就已经有水流出来了。

这也是目前文生视频大模型的短板——不懂物理世界以及因果关系等。在中国政法大学传播法研究中心副主任朱巍看来,大模型所生成的视频代表着AI对这个世界规律的理解,但这不一定都是正确的,因此也让眼见不一定为实。

更广泛的担忧,是视频的可信度高于文字和图片,一旦生成门槛被大幅降低,难辨真伪的虚假视频可能会被用于传播谣言、诈骗等非法领域。对此,朱巍认为,应参考此前针对生成式AI的相关规定,对AI生成内容予以标识。

此外,创作者用一段文字生成视频后,该视频的版权归属等问题也需要重新梳理。目前,针对AI生成文字或图片的著作权归属问题已形成争论。去年年底,北京互联网法院就针对一起人工智能生成图著作权侵权纠纷案做出一审判决,这也是我们首例涉及AI文生图著作权案件。法官认为,人们利用生成式人工智能生成图片时,本质上仍然是人利用工具进行创作,如果能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法的保护。

标签: