中经记者李昆昆李正豪北京报道
近日,OpenAI推出的AI视频生成应用Sora表现抢眼,凭借其独特的AI技术成功超越Google的Gemini和OpenAI的ChatGPT,成为苹果App Store免费应用榜榜首。
谈及Sora能否超过目前以抖音、快手、TikTok等为代表的短视频应用,速途研究院院长丁道师告诉《中国经营报》记者,它们在某种程度上会相互融合。抖音上的内容,人工智能制作的视频占比越来越高,比如到了明后年,国内的人工智能视频生成技术大幅进步的话,会有大量的人工智能生成的视频产生。它应该是你学习我、我学习你、相互融合的趋势。短期内还看不到其能把抖音取代,因为抖音的算法优势很强,有好几亿有黏性的用户,不是短期内可以被取代的。未来做得好的话,它们应该会并列为行业头部的App。
物理世界模拟器
据了解,在Sora的最新版本Sora2上,用户可以制作并分享由版权内容生成的AI视频,混剪他人视频并发布到类似社交媒体的内容流中。该应用仅支持iOS设备,用户需通过邀请码获取访问权限。
谈及Sora2和Sora的对比,丁道师表示,在制作精度上或者说拟真方面实现了较大幅度的跃进。“去年我们还说,谁可以让中国版的Sora缩小差距,但是现在Sora2一出来,差距可能要被扩大了,甚至我还输入一些中国古典的诗词,其也能理解并生成符合诗词含义的视频内容,这是它的第一个特点。第二个特点就是它就是一个生成的工具,现在生成内容直接就可以发布到一个类似于抖音的界面,所以有人称它为AI版的抖音。在这个界面中,全是用人工智能生成的视频,点赞、分享功能都有。”
阳明商业论创始人沈阳告诉记者,在技术层面,Sora2是质的飞跃,也是世界模型的一个初步显现,Sora2最令人震撼的并非只是生成视频,而是它展现出的对物理世界(如物体运动、光影变化、材质互动)的初步理解和模拟能力。这暗示它不再仅仅是学习像素的统计规律,而是在构建一个简单的世界模型。在涌现能力方面,它能够理解复杂的摄像机运动、长镜头连贯性以及多个角色与环境的互动。这些能力并非被明确编程,而是从海量数据中“涌现”出来的,这标志着生成式AI进入了新的阶段。它是“虚拟世界内容物理学”的基石:它正在成为理解和解构视觉内容背后规律的基础模型。
OpenAI在公告中也承认:“之前的视频模型过于乐观——它们会扭曲物体和变形现实,以成功执行文本提示。”而Sora2“在遵循物理法则方面比之前的系统更好”。
一位体验者兴奋地分享,Sora2能识别复杂的“脚本化指令”,包括场景、动作、声音、情绪、BGM甚至后期要求,真正实现了“脚本直出内容”。
Sora2多镜头序列处理能力更是让专业视频创作者都感到惊讶,其系统能够在场景变化中保持连续性,这需要对角色和环境有深刻的理解。这意味着AI不再只是生成孤立的画面,而是在构建一个一致的视觉故事。
下转 C3