
AI
而且,那种强大,足以让我震惊一万年。
我先举三个例子,再详细说明。

OpenAI
过去的AI视频工作流已成过眼云烟,统统滚蛋吧。全都跪下,喊OpenAI为爸爸。这种行为实在可笑至极。回归三个最重要特点:60秒超长时长、单视频多角度拍摄,尤其是核心的世界模型。当多数AI视频还在努力维持4秒连贯性时,OpenAI却直接宣称:强烈支持,六十秒,全都给我跪下。
简直太令人害怕了...看看这个案例。
一位时髦女性漫步在东京街头,街道点缀着温暖的霓虹灯与动画招牌。她身着黑色皮夹克、红色长裙,脚踩黑靴,手提钱包,戴着太阳镜,嘴唇抹着鲜艳的红唇膏。她的步伐自信而从容。湿漉的街道泛着光泽,在彩灯映照下如镜般闪耀,四周行人络绎不绝。
60秒一镜到底,不仅主人物稳定,背景人物也稳得惊人。画面从大全景无缝过渡到面部特写,行云流水。这并非我能用对AI视频的肤浅理解所能够解释清楚的。我完全不清楚实现方法,官网解释如下:
等待他们发布技术文档。如今的AI工作流已实现单镜头生成,视频多角度切换时,主体一致性依然完美,这在以往是难以想象的。OpenAI仅用一个Prompt,就在一分钟画面里实现多角度切换,物体保持一致,效果流畅自然……
一个优美的剪影动画描绘了孤狼对月长嚎,孤独徘徊,直至融入狼群的温暖怀抱。
太恐怖了,孤狼对月长嚎,孤独至极,直至遇见狼群。 孤独。这个词在这个视频中被诠释得十分到位。多镜头无缝切换,每个分镜运用都极为讲究,画面表现力极强。其他家的AI视频还在冷兵器时代搏杀,这玩意直接祭出了超电磁炮,一炮轰得人头晕脑胀。我曾写过一篇文章,探讨了有关世界模型的一些话题。在我看来,构建世界模型最难的在于数据的收集与清洗。Runway的世界模型,毫无变化。不过,OpenAI的Sora直接掀起了一波大动作。从之前的视频案例中可以看出,Sora已经能够理解物理规律了。比如这个案例:
一只猫叫醒主人讨要早餐,主人装睡不理。猫换个方式撒娇,主人无奈,从枕头下掏出藏着的零食,打发它再等等。
这个视频最夸张的是...在AI世界里,猫居然也能踩奶了,这真是让所有养猫的人都深有体会。另有一个驾驶案例,超越全球所有AI视频。
一辆白色的老式SUV,顶配黑色行李架,在崎岖的土路上飞驰而过。山坡陡峭,松树环绕,阳光洒满大地,为整个场景镀上一层温暖的光辉。车轮卷起尘土,沿着蜿蜒的小路一路向前,前方空无一物,唯有无尽的自然风光。两旁红杉挺立,绿意盎然,点缀其间。从后方望去,这辆车从容地穿梭于弯道之间,仿佛完全不受地形限制。四周群山起伏,丘陵连绵,蓝天澄净,白云悠悠,将这片天地装点得如诗如画。
最后一个我觉得特别离谱的情况是:
这种真实的物理感受,真的很希望它们是过拟合了……之前与某些大佬交流得知:人类经过千万年的进化,对世界的常识已深植于基因中。人脑能够迅速过滤冗余信息,提取关键内容并进行推理判断。然而,机器不具备这种能力,目前还无法理解抽象概念。因此,需要设计模仿人类抽象过程的学习算法,帮助机器从视频数据中提炼重要信息,逐步实现更高效的处理与理解。数据收集,这活儿最难。而OpenAI或许已经找到了解决办法。
尽管他们承认,其世界模型仍存在诸多缺陷……然而事情并未结束
尽管他们承认,其世界模型仍存在诸多缺陷……只是...
一年时间,OpenAI推出了一项震撼全球的重磅成果。没有任何消息泄露,没有一点预热,直接重磅出击。更劲爆的是,他们宣布今晚将更新技术论文:
一夜无眠,我在各个群里看到最多的话是:这可如何是好...全都去死吧这个领域快要消亡了……不只是AI视频行业,众多传统影视公司也面临同样的情况……例如虚拟拍摄、特效制作、广告宣传等……功成者少,牺牲者多。实在想不出更合适的形容词了。按照当前AI的发展速度,通用人工智能似乎指日可待。但愿这并非人类的衰落时刻。
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号