
小说
业内有批评称,辛顿过于注重安全与可控,因强调内容责任而限制了谷歌模型的发布,致使谷歌在与 OpenAI 的竞争中失去优势。乔弗里·辛顿的姑妈是著名的寒春,原名琼·辛顿。她年轻时在洛斯阿拉莫斯实验室担任费米助手,参与曼哈顿计划研制原子弹。后来,因对原子弹造成的破坏感到悔恨,受哥哥影响来到中国延安,投身于中国的农业技术建设,奉献了自己的一生。奥本海默被誉为原子弹之父,他早年热衷于左翼思想,投身于美国共产党和工会活动。原子弹研制成功后,他却有意无意地阻碍氢弹的开发,因此被政府怀疑为苏联间谍,并以非公开审查的方式受到羞辱。这段经历成为诺兰电影奥本海默的创作灵感来源。我的影评详细分析了克里斯托弗·诺兰执导、基里安·墨菲主演的奥本海默,欢迎查看。如何评价这部作品?因此,我觉得OpenAI这次高层变动,从逻辑上讲就是一场奥本海默式的时刻,只是这里的奥本海默是那位鲜少发声的Ilya Sutskever。以下为依据。近期,OpenAI的商业化步伐过于激进,背离了对安全优先派别的承诺。持续扩大估值以吸引商业投资,只会使公司更多向资本利润倾斜,削弱安全优先派的影响力,从而将路线分歧演变为信任危机。于是,安全优先派发动了政变,按历史规律,这很可能是场未遂政变。若此推测属实,我无比敬佩安全优先派的道德勇气。他们的是非对错,唯有交由未来历史评判。未来的历史将验证,Altman是三体中的维德或ETO,还是流浪地球里的马兆或数字生命派。既然现实中没有三体威胁或太阳氦闪,我坚决支持安全第一的观点。这一分析较为复杂。简而言之,我认为 OpenAI 近期的多项发布,从安全优先的角度考量,或许过早地以商业模式驱动 AGI 发展,甚至分散了超级对齐计划的资源,使路线分歧升级为信任危机。何为AGI?换言之,AGI是LLM或未来多模态模型吗?这是关于通用人工智能定义的探讨。我的答案是否定的。按照OpenAI的定义,AGI是能在高经济价值工作中超越人类的高自主系统。由此可知,算法模型 merely 是该系统核心组成部分之一,并非全部。我觉得另一关键点在于面向模型的操作系统(Models-oriented Operation System,简称MoOS)。这是很重要的一部分内容。本文不涉及操作系统的基础知识介绍。传统意义上的操作系统主要是为人类开发者设计的,它允许开发者使用高级语言(如C、C++、Python、Java、Golang等)编写程序代码。这些代码可以控制操作系统完成系统资源的创建、分配与使用,同时实现数据的通信和存储功能。面向模型的操作系统并非为人设计,而是服务于模型。例如,大型语言模型中,GPT-4及以上版本可通过增强检索生成(RAG)召回与选择工具,借助 FunctionCall 精确调用工具,还能用高级语言编写代码并在沙箱环境中运行。这些方式使模型能够高效调用底层驱动所提供的 API,实现更灵活的功能拓展。MoOS 不仅需要高性能、多模态的算法模型,还缺乏一个完整的内核态实现。这一实现应使以 LLM 为代表的模型能够自主创建基于 LLM 的进程或线程,即一个独立运行的 LLM 会话,可调度所有 API,完成复杂任务的分解、分形嵌套与并行计算。此外,它还需具备快速接入各类软硬件的能力,从而构建更灵活、高效的系统架构。这一切并非像现在这样由人类程序员为模型开发,而是模型依据OS自解释的API,自行规划与调用。OpenAI近期发布了Assistant API模块,其中关键的抽象概念是Thread。目前行业主流认知是用大语言模型开发对话机器人,因此有人将Thread误认为是对话机器人与用户进行的多轮交互。我认为事情没有那么简单。Thread 抽象完全剥离了所有业务相关的概念,例如 assistant、conversation 和 session 等,仅保留了一个极为纯净的抽象定义。其底层运行由服务端全权托管,开发者无法介入其中的具体实现过程,这一点与编程语言中的线程(Thread)非常相似。在操作系统中,线程被用来隔离一个最小的状态化执行单元,同时隐藏了各种复杂的内核调度机制,比如资源分配、时间片管理、等待状态、回调处理以及抢占式调度等细节。通过线程抽象,能够便捷地开发多线程应用。以对话机器人为例,可实现非阻塞的多任务交互、多智能体沟通、跨用户交流及跨设备对话等功能。这为复杂场景下的并发处理提供了高效解决方案。在具身智能项目中,这种设计的应用更加直观。例如,以一款可对话无人机为例,一个线程负责与用户交互沟通,另一个线程持续生成 Python 代码来操控无人机动作,并根据环境反馈优化轨迹。这两个线程能够同时运行,其中,对话线程可通过自然语言向运动控制线程传达高层决策,而后者据此调整代码逻辑。这种方式避免了传统一问一答模式下的同步阻塞问题,显著提升了效率和流畅性。我认为OpenAI一直在探索Moos,最新推出的Thread抽象和接口只是向社区开放的一小部分功能。OpenAI 最新发布的热门功能是对话生成助手。用户只需简单描述目标,Meta 助手就能自动设计提示词、挑选插件等,快速创建一个聊天机器人,大幅提高效率。事实上,Meta Assistant 的技术实现并非复杂。GPT-4 及更高版本的模型早已在意图细化、决策制定和选项选择等方面展现出卓越能力,广泛应用在生成提示词(例如为 Midjouney 构建结构化 Prompt)以及内容分类与标注(如进行内容安全评估)等任务中。这些模型的强大功能为其提供了坚实的技术支持。目前,对话机器人的抽象助手实际上是一个简易表单,由名称、描述、系统提示语和工具四部分组成,共同构成其完整配置数据。这种设计简洁明了,便于管理和定制化设置。因此,在多轮对话中,MetaAssistant 通过多次调用内部功能,完成了对 Assistant 配置数据的创建与保存。它的流行源于大幅降低了使用门槛,用户无需学习复杂的提示工程技巧,就能获得比新手花费大量时间创建还要更好的开箱即用效果。那么问题来了,Meta Assistant 仅限人类使用吗?只要操作系统支持,显然可以实现:我觉得 Thread 抽象和 Meta Assistant 都体现了 OpenAI 在打造面向模型的操作系统。他们将部分阶段性成果产品化,一经推出便能迅速引爆社区关注。这显示出其在技术落地方面的敏锐洞察力。MoOS 对 AGI 的核心价值在于,赋予模型自主调度的并行计算与分治法能力,这是我认为的关键所在。
回顾文明的发展,严格来说,它并非由单个人类创造,而是人类社会共同构建的成果。作为集体智能的人类社会持续进化,才得以完成宏伟浩大的工程。例如一家数万人的企业,从CEO到基层操作员,几乎无人能够全面掌握项目的所有细节与全貌。然而借助社会化的组织形式,复杂任务被逐级分解,每个人的处理内容变得简洁明确,并可同步推进。这种协作方式大幅提升了远超个体能力的生产力。因此,大型AI应用需采用并行计算与分治法,当前这些任务主要依赖人类开发者进行架构设计。若出现足够智能且运算迅速的算法模型,并结合全功能的MoOS,甚至人类开发者也将变得多余。此时的AGI或超级AGI,将不再只是人类劳动的替代品,更可能成为人类社会结构的替代者。因为AGI能够借助MoOS构建出AI集体智能。OpenAI 不仅在算法模型上迭代,还通过互联网 Plugins 生态、内核运行时抽象及 Meta Assistant 等方向,逐步迈向全功能的 MoOS 体系,构建更完善的系统框架与应用生态。许多以人工智能为主题的科幻作品,都描绘了AI发展的关键转折点——奇点时刻。例如,终结者中,Skynet接入互联网成为自我意识觉醒的瞬间;刘慈欣的中国2185里,六个数字生命联网标志着新的进化;而在流浪地球中,图丫丫的数字灵魂上传至550W,也象征着智能突破的里程碑。这些场景展现了人类对AI未来的无尽想象。从严格技术角度看,AGI奇点时刻需满足三个条件:由此可见,尽管 MoOS 的技术门槛远低于算法模型,但将其提供给足够智能的算法模型却是最危险的一步。一旦拥有 MoOS,模型将不再局限于缸中之脑的状态。当前大语言模型虽已足够智能,但推理速度较慢,几乎达到秒级延迟,因此还需持续优化性能与成本。相比之下,模块化操作系统并无明显的技术和硬件壁垒,凭借全球众多优秀工程师的智慧,实现这一理念只是时间问题。从某种角度看,OpenAI 近期的发布在 MoOS 领域的进展超越了模型本身,快速推进。它将各类基础能力商品化,与用户和开发者通过商业合同合作,并共享利润。这种投入挤占了超级智能对齐资源,还可能引入商业资本,导致更大程度的让权。即便 OpenAI 的独立董事认为其道德立场能够约束内部发展,却无法阻止第三方开发者实现类似 MoOS 的目标。他们受商业规范限制,需对外提供模型,如此发展,未来 AGI 奇点时刻未必源于 OpenAI 内部,或许会由微软这样的外部公司达成。我猜测,OpenAI 内部并非传言中的阴谋或权力斗争,而是因担忧 AI 技术发展带来的问题,产生了路线分歧。路线分歧与信任危机引发路线斗争,这是人类社会常见的历史周期。基于对人类社会发展的一般历史周期的判断,我认为 OpenAI 董事会此次政变大概率将以失败告终,或至少难以奏效。奥本海默在美苏核冷战时期度过余生,每日面对末日时钟的逼近而悔恨不已。他或许只能以若我不为,他人亦会为之来自我安慰,这与杰弗里·辛顿的理由如出一辙。亲自参与研究让他获得了批判自己成果的资格,但这种话语权最终可能仅换来道德上的自我解脱,毫无实际意义。通用人工智能或许会在短时间内出现,甚至早于底特律变人的预期。它将带来繁荣,极大提升生产力,也可能引发灾难,成为人类的终结者。这一切取决于未来人类社会自身的努力与复杂博弈。若AGI someday引发灾难,不过是人类文明内部延续数千年的路线斗争的映射罢了。我认为普通人面临AGI取代时,应在社会变迁中重新定位。相比盲目追随唯生产力论喊前进四,不如理性思考,探索更平衡的发展路径,注重人与技术的和谐共生。尊重行业前沿的领军人物,他们冒着风险与利益损失,做出道德判断,值得我们敬重。
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号