OpenAI发布Sora文生视频模型，如何评价其影响？

OpenAI

1个回答

写回答

yeahjin-

2025-12-26 23:15

+ 关注

刚和朋友玩完LOL手游，准备马上睡觉。睡前刷了一下X。然后，我看到了一则消息，简直让我震惊得像个傻子一样。

而且，那种强大，足以让我震惊一万年。

我先举三个例子，再详细说明。

OpenAI
OpenAI

我忽然想起三体里杨冬的一句话：物理学科已不复存在。这句话可以这么用。就是这样了。一切都不复存在了。

过去的AI视频工作流已成过眼云烟，统统滚蛋吧。全都跪下，喊OpenAI为爸爸。这种行为实在可笑至极。回归三个最重要特点：60秒超长时长、单视频多角度拍摄，尤其是核心的世界模型。当多数AI视频还在努力维持4秒连贯性时，OpenAI却直接宣称：强烈支持，六十秒，全都给我跪下。

简直太令人害怕了...看看这个案例。

一位时髦女性漫步在东京街头，街道点缀着温暖的霓虹灯与动画招牌。她身着黑色皮夹克、红色长裙，脚踩黑靴，手提钱包，戴着太阳镜，嘴唇抹着鲜艳的红唇膏。她的步伐自信而从容。湿漉的街道泛着光泽，在彩灯映照下如镜般闪耀，四周行人络绎不绝。

60秒一镜到底，不仅主人物稳定，背景人物也稳得惊人。画面从大全景无缝过渡到面部特写，行云流水。这并非我能用对AI视频的肤浅理解所能够解释清楚的。我完全不清楚实现方法，官网解释如下：

等待他们发布技术文档。如今的AI工作流已实现单镜头生成，视频多角度切换时，主体一致性依然完美，这在以往是难以想象的。OpenAI仅用一个Prompt，就在一分钟画面里实现多角度切换，物体保持一致，效果流畅自然……

一个优美的剪影动画描绘了孤狼对月长嚎，孤独徘徊，直至融入狼群的温暖怀抱。

太恐怖了，孤狼对月长嚎，孤独至极，直至遇见狼群。孤独。这个词在这个视频中被诠释得十分到位。多镜头无缝切换，每个分镜运用都极为讲究，画面表现力极强。其他家的AI视频还在冷兵器时代搏杀，这玩意直接祭出了超电磁炮，一炮轰得人头晕脑胀。我曾写过一篇文章，探讨了有关世界模型的一些话题。在我看来，构建世界模型最难的在于数据的收集与清洗。Runway的世界模型，毫无变化。不过，OpenAI的Sora直接掀起了一波大动作。从之前的视频案例中可以看出，Sora已经能够理解物理规律了。比如这个案例：

一只猫叫醒主人讨要早餐，主人装睡不理。猫换个方式撒娇，主人无奈，从枕头下掏出藏着的零食，打发它再等等。

这个视频最夸张的是...在AI世界里，猫居然也能踩奶了，这真是让所有养猫的人都深有体会。另有一个驾驶案例，超越全球所有AI视频。

一辆白色的老式SUV，顶配黑色行李架，在崎岖的土路上飞驰而过。山坡陡峭，松树环绕，阳光洒满大地，为整个场景镀上一层温暖的光辉。车轮卷起尘土，沿着蜿蜒的小路一路向前，前方空无一物，唯有无尽的自然风光。两旁红杉挺立，绿意盎然，点缀其间。从后方望去，这辆车从容地穿梭于弯道之间，仿佛完全不受地形限制。四周群山起伏，丘陵连绵，蓝天澄净，白云悠悠，将这片天地装点得如诗如画。

最后一个我觉得特别离谱的情况是：

与中国龙共庆中国农历新年的视频。

这种真实的物理感受，真的很希望它们是过拟合了……之前与某些大佬交流得知：人类经过千万年的进化，对世界的常识已深植于基因中。人脑能够迅速过滤冗余信息，提取关键内容并进行推理判断。然而，机器不具备这种能力，目前还无法理解抽象概念。因此，需要设计模仿人类抽象过程的学习算法，帮助机器从视频数据中提炼重要信息，逐步实现更高效的处理与理解。数据收集，这活儿最难。而OpenAI或许已经找到了解决办法。

尽管他们承认，其世界模型仍存在诸多缺陷……然而事情并未结束

尽管他们承认，其世界模型仍存在诸多缺陷……只是...

一年时间，OpenAI推出了一项震撼全球的重磅成果。没有任何消息泄露，没有一点预热，直接重磅出击。更劲爆的是，他们宣布今晚将更新技术论文：

一夜无眠，我在各个群里看到最多的话是：这可如何是好...全都去死吧这个领域快要消亡了……不只是AI视频行业，众多传统影视公司也面临同样的情况……例如虚拟拍摄、特效制作、广告宣传等……功成者少，牺牲者多。实在想不出更合适的形容词了。按照当前AI的发展速度，通用人工智能似乎指日可待。但愿这并非人类的衰落时刻。

举报有用（0）分享收藏

OpenAI发布Sora文生视频模型，如何评价其影响？

1个回答

yeahjin-

热门话题

相关问题