马斯克昨天发推称人类将跨越卡尔达肖夫一级文明门槛(完全掌控地球能源)
今天红杉资本就在一个放出的初创公司访谈中,描述了实现卡尔达肖夫二级文明的方法论
更重要的是,在此之前,亿万个能力快速进化的ai工程师将建设未来星舰,核聚变反应堆,火星城
过程中顺便淘汰人类工程师,以下是全文:
访谈记录:从数据中心到戴森球——P-1 AI硬件工程AGI的探索之路
采访者:
最近几年我一直在思考一个问题:为什么目前没有团队专注于为物理世界打造AI?毕竟,我们现在看到的软件工程领域有很多突破,但硬件工程似乎还没迎来大的变革。对此,您怎么看?
Paul Arnango(P1 AI CEO):
这是个非常好的问题。说到底,关键在于训练数据的匮乏。举个例子,如果你想要一个AI工程师帮你设计或改进一架飞机,比如说,“如果我把A320机翼面积增加10%,会发生什么?”你就必须有成百万甚至千万级的飞机设计数据来训练模型,这样模型才有能力去回答这个问题。
我个人的背景是在DARPA做主管,35岁时成为空客最年轻的CTO。如今,我希望通过P1 AI,将我童年时的科幻梦想变为现实。我们的目标是打造一款适用于物理世界的工程级AGI。
采访者:
目前软件工程领域正在经历快速发展的“垂直起飞”,像AI辅助的24/7初级软件工程师即将成为现实。那么物理工程领域有什么样的进展呢?
Paul Arnango:
坦率地说,目前还没有太多。P1 AI成立的初衷之一,正是因为我们热爱硬科幻,但直到2025年,这个领域的AI应用依然没有大突破。我们分析了背后的原因,并找到了可能的解决方案,希望能尽快将这些技术推向市场。
我非常感谢Jeff成为我们的天使投资人。编码AI的出现其实已经期待了很久,我们相信这不会再需要十年或十五年时间。我们预计今年可以搭建起技术基础,并在明年找到产品与市场的匹配点。
采访者:
您刚才提到的“技术基础”具体包括哪些方面?哪些关键环节是必须要有的?
Paul Arnango:
回顾航空历史,自莱特兄弟以来,即使你能拥有所有飞机设计数据——其实不可能——且所有数据都是语义上统一和连贯的——实际上也不是——你也不过拥有大约一千个设计样本,这远远不够训练大型模型。
因此,我们的最基础技术就是在主流设计周围密集采样训练样本,同时在设计空间的边缘和角落稀疏采样。即使设计空间的某些区域不是理想方向,采样这些点能教给模型为什么这些设计不可行,这对于模型理解非常关键。
同时,我们还构建了一个大型语言模型(LLM)作为“指挥官”和推理器,并作为用户接口,协调模型运作。
采访者:
这听起来非常复杂。您能详细讲讲如何让模型具备基于物理的推理能力吗?这类推理能力现在是否已有设计软件实现?这些知识是如何被注入模型的?另外,供应链信息又是如何融入系统的?
Paul Arnango:
我们让系统根据设计需求提出多个解决方案,先进行第一性大小估计,判断答案的大致形态,同时分析涉及的物理现象。这里的物理现象包括多种物理属性——不仅仅是几何形状,还包括电学、热学、振动、电磁干扰等多物理因素,这些都会影响设计。
我们的首款产品叫“Archie”。“Archie”是智能代理的代号,我们聚焦认知自动化,并非尝试替代已有设计与仿真工具,而是让Archie能够像人类工程师一样熟练使用这些工具。
这些基本操作包括设计评估(判断设计性能)和设计合成(根据性能需求生成设计)。另外,我们采用图神经网络来构建基于物理的代理模型,能够高效模拟性能空间;还有几何推理模型,用于空间定位、包装和干涉判断,具备复杂空间推理能力。
在多物理推理方面,我们结合传统软件1.0方法和神经网络技术。例如,我们开发了“labbotomized LLM”,它不再擅长英语表达,但擅长用程序化方式表示多物理系统。
我们的预研demo以住宅冷却系统为例,涵盖流体流动、热力学、电气系统等多物理交互。我们致力于打造适用于物理系统工程AI的评估方法,已经准备发表名为“Archie IQ”的论文,将评估方法应用于人类工程师。
采访者:
在训练数据方面,您是如何规划的?住宅冷却系统是起点吗?未来的发展路线图是什么?
Paul Arnango:
是的,住宅冷却系统是我们的起点。数据中心冷却系统是工程瓶颈所在,现有的交付能力严重受限于工程师的带宽,尤其是半定制解决方案的供给。
我们的客户对此热情很高。当前系统大约包含1000个独特部件,且每年产品复杂度至少翻倍。
第二个垂直领域是工业系统,比如工厂里的物料搬运设备和工业机器人等。然后是移动领域,包括汽车、农业机械、采矿设备,最终进入航空航天和国防装备。
我们计划训练Archie达到入门级工程师水平,具备大学学历背景,但不熟悉某家公司的具体产品细节或深度流程,也不了解供应链细节。我们可以整合模型驱动工具、实际系统性能和质量反馈等现实世界数据,让Archie快速提升至中高级工程师水平。
采访者:
您提到的工程任务分层体系是什么样的?
Paul Arnango:
我们设计了一个金字塔型的任务体系:
底层是信息回忆,比如识别和记忆零部件,这是相对简单的任务;
中层是语义理解,比如理解某个零件的功能;
高层是设计评估,包括评估更改零件对性能的影响、工艺限制、替代方案及可能错误等。这些能力通常只由资深工程师和大型工业公司的技术专家掌握。
对我们来说,顶层的工程智能是对自身能力和局限的自我认知。
采访者:
对于更复杂的系统,比如零件数量极多的飞机,您认为挑战仅是计算规模,还是需要技术突破?
Paul Arnango:
我们认为不需要重大技术突破。挑战主要在于算力和训练数据的规模。目前的GPU推理算力还不足以处理百万级零件系统,尤其是训练数据集的构建非常复杂。
为此,我们开发了大量自动化和AI工具,帮助我们建立组件目录和模型。组件必须智能组装,不能像风暴扫过废料场那样随意拼装,而是要有规则地组合并仿真其性能,确保设计的可行性。
采访者:
作为前空客CTO,您如何看待客户视角和工程师工作流程?
Paul Arnango:
客户的工程师通常负责子系统或组件的设计,从需求中提炼关键设计驱动因素,提出解决方案,进行初步尺寸设计和详细分析。这个流程会在整个工程组织层层递归。
Archie的目标是成为团队成员,帮助复制和加速这一流程。
采访者:
推广新软件给大型企业像空客这样的公司是否困难?
Paul Arnango:
非常困难。工业生态系统中已有数百乃至上千种工程工具,它们通过复杂且不总是优雅的方式连接。新工具的引入常常遭遇摩擦。
但Archie的引入门槛低,不改变现有流程,相当于新增了一个低成本员工。它可能在某些任务上优于人类,在某些方面不及,但目标是作为有效的团队成员存在。
采访者:
为什么叫“Archie”?未来的应用场景是什么?
Paul Arnango:
“Archie”名字最初用于半定制产品定制领域,尤其是数据中心冷却设备的“特殊品”定制,满足具体客户的建筑规范和功能需求。
展望2030、2040年,全球将可能拥有数百万甚至数千万个Archie以及其他智能代理,实现物理世界的工程AGI。
采访者:
Archie是否能够促进团队间的协调?
Paul Arnango:
是的,我们设想Archie能在各团队间协调交流,甚至比人类工程师更高效,拥有自己的“行话”,极大提升工程组织效率。
采访者:
您提到的“戴森球”、“星舰”等未来愿景是什么?
Paul Arnango:
这些是我作为创始人的梦想,也是我们的北极星指引。但我们同时致力于打造务实、盈利的企业。
我们的合作伙伴Constantine提出“随机思维”(stochastic mindset)——物理世界充满随机性,人类工程师同样会犯错,不可避免地表现不稳定。
采访者:
您计划如何衡量Archie的表现?
Paul Arnango:
我们计划今年开展试点,量化Archie的错误率。如果错误率和人类工程师相当,意味着我们的系统达标。
采访者:
未来的工程团队会是什么样子?
Paul Arnango:
未来几年内,我们希望在每个工程团队部署Archie,使其占比达到10%。Archie承担重复且枯燥的工作,并带来团队间的协同增效。
采访者:
关于类人机器人,您怎么看?
Paul Arnango:
我们认为构建能够融入现有团队的智能代理很重要,类人机器人能更顺利地融入现实环境,尽管它们可能不是最优解。
我们对神经网络为何有效尚无完全理解,但我们用类神经元的方式构建系统,堆积大量神经元后出现了令人惊叹的涌现性质。
我们先从语言模型开始,爬取互联网海量数据,之后扩展到视频和图像,暂时未涉及触觉、味觉和听觉。触觉对空间感知尤为关键。
采访者:
最后,您个人最喜欢用的AI应用是什么?
Paul Arnango:
答案可能比较平凡,是ChatGPT和Cursor。但更令人兴奋的是,我们刚刚发布了一个短片,所有声音、视频和音乐完全由AI生成,利用了多种模型和生态系统拼接技术,效果非常震撼。
感谢您的邀请,很高兴分享我们的愿景。
本文作者:Samjoe Yang
本文链接: https://need.uno/ren-lei-jiang-tu-po-yi-ji-wen-ming/
版权声明:本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。
评论