
如今,如果有人在Spanx公司的网站上订购塑身衣,处理包裹的是一台人形机器人。在乔治亚州GXO物流公司的配送中心,Agility Robotics公司的双足机器人正以机械般的精准度搬运货物。而在宝马集团的斯帕坦堡工厂,Figure 02机器人在将钣金零件插入底盘组件时实现了400%的速度提升。
这些都不是实验室演示或风投炒作,而是真正创造收入的部署,标志着机器与我们物理世界交互方式的根本性转变。
智能机器人时代已经到来。先进硬件现在通过视频、音频和传感器阵列将人工智能模型连接到现实世界,使AI能够控制从装卸货物的自动托盘车到能够进行精细运动和工具操作的人形机器人等一切设备。这种变革远远超越了工厂车间——涵盖了在城市街道上导航的自动驾驶汽车、响应居住者需求的智能建筑,以及智能照料作物的农业机器人。
这场革命由"物理AI"的出现推动:将人工智能集成到物理系统中,使机器人和机器能够实时感知、推理并适应现实世界。与遵循僵化编程的传统自动化不同,物理AI系统将复杂算法与传感器和执行器相结合,以应对不可预测的环境并处理可变任务。
"我们在构建身体方面变得非常出色,"亚马逊机器人技术首席技术官泰·布雷迪说道。"现在我们正在通过生成式AI为身体带来大脑。"
为了理解物理AI如何重塑整个行业,并评估AI的下一次飞跃何时会大规模进入工厂、企业和家庭,SiliconANGLE采访了关于这项技术从实验性好奇转向商业必需品的领先专家和高管。
"物理AI已经达到了技术成熟度与市场需求相一致的关键拐点,"先进机器人解决方案领导者Teradyne Robotics的首席人工智能官詹姆斯·戴维森说道。"市场动态已经从怀疑转向了证明。早期采用者正在报告切实的效率和收入增长,我们已经进入了我所称的采用的早期多数阶段,投资规模大幅扩大。"
这种戏剧性的扩张反映在风险投资流向上。根据Mind The Bridge的最新分析,硅谷几乎完全将其投资论点重新定向为人工智能,93%的风险投资现在流向与AI相关的初创公司。仅2024年,物理AI公司就吸引了超过75亿美元的投资,巨额轮次成为常态:杰夫·贝佐斯支持的Physical Intelligence以24亿美元估值筹集了4亿美元,Figure AI获得了6.75亿美元,Skild AI完成了3亿美元的融资。
这种势头在2025年只会加速。Figure AI在9月又筹集了10亿美元,Physical Intelligence回来再筹集了6亿美元,而开发能够在三维环境中导航的人工智能模型的初创公司General Intuition在10月筹集了1.337亿美元。由贝佐斯和连续创业者维克·巴贾伊共同领导的初创公司Project Prometheus,致力于开发"物理经济的AI",筹集了巨额的62亿美元。
根据金融研究公司Crunchbase的数据,在2025年的前七个月中,已有超过60亿美元的资本流入机器人公司和初创企业。按照这种速度,Crunchbase预测今年的资金将超越2024年的水平。
虚拟世界,物理影响:基础模型的崛起
物理AI的快速发展得益于机器人基础模型(RFMs)的发展:能够接收信息并使用推理来指导在现实世界中执行的机器人动作的AI软件"大脑"。
这些模型通常建立在视觉-语言模型之上:具有多模态能力的预训练Transformer模型,能够感知世界并允许机器人识别物体和理解物理学。RFMs种类繁多,从Physical Intelligence用于各种机器人的通用π0模型到英伟达的GR00T人形机器人通用模型。
诞生这些模型的技术突破是视觉-语言-动作模型(VLAs)。谷歌DeepMind在2023年开发的机器人Transformer 2,通过扩展两个最先进的基础模型PaLI-X和PaLM-E,为智能机器人设定了范式。VLAs在大量机器人动作数据集上进行训练,使它们能够泛化到新任务。
VLAs使机器人能够将提示转化为动作,例如"请拾起垃圾并扔掉"。模型的训练数据提供了关于事物外观的知识语料库和处理动作的机器人轨迹集。在这种情况下,即使机器人没有专门接受过丢弃垃圾的训练,它仍然可以通过摄像头识别物品为"垃圾",抓取它们,找到合适的垃圾桶并执行丢弃动作。
这一发展标志着从基于规则的指导(机器人肢体触发预编程动作)向能够智能确定和执行动作的计算机推理的根本转变。
为了训练和准备这些模型,出现了一种新的专门AI模型类别:世界基础模型(WFMs)。WFMs为机器人AI服务两个主要功能:它们使工程师能够快速开发大量合成数据集来训练机器人执行未见过的动作,并在现实世界部署之前在虚拟环境中测试这些机器人。
WFMs允许开发者通过环境的"数字孪生"创建模拟现实的虚拟训练场。在这些模拟场景中,机器人安全地学习应对现实世界的挑战,速度远超物理存在所允许的速度。
例子包括英伟达的Cosmos平台(为机器人和自动驾驶汽车开发WFMs)和Waabi Innovation的Waabi World(设计用于教授自动卡车AI模型如何安全应对各种道路条件的WFM)。World Labs Technologies最近推出了Marble,一个功能齐全的虚拟世界生成器,谷歌DeepMind推出了Genie 3,一个能够产生交互式虚拟世界的AI模型。
"Cosmos通过指数级扩展现有数据并解决关键的模拟到现实挑战——虚拟训练与物理世界复杂性之间的细微但重要差异,弥合了这一差距,"英伟达机器人产品经理斯宾塞·黄说道。
AI先驱扬·勒昆离开Meta平台公司去追求开发WFMs的初创企业,因为他相信世界模型将比Meta专注于语言模型更大程度地推进AI行业的发展。
生成大量物理精确训练数据的能力代表了行业的分水岭时刻。传统机器人需要费力的现实世界数据收集——昂贵、危险且范围有限——而WFMs可以在曾经收集数百个场景的时间内产生数百万个训练场景。
"我们为自动驾驶构建元宇宙,"Waabi首席执行官拉克尔·乌尔塔松解释道。"Waabi World作为世界模型,以一种也根植于现实的方式构建,这对于物理AI非常重要,而不是你不希望在模拟系统中出现的幻觉和类似问题。"
Waabi的方法实现了前所未有的99.7%模拟真实度,证明虚拟训练环境现在可以以近乎完美的保真度镜像物理世界。
WFMs还将智能机器人行业扩展到了机器人肢体、无人机和人形机器人之外。由于WFM创建现实世界的"数字孪生"来模拟和理解真实环境,它可以训练任何类型的机器人,甚至传统上不被视为机器人技术一部分的系统,如物联网网络、智能建筑和智能城市。
开发物理AI基础模型的公司Archetype AI创建了Newton,这是一个设计用于实时理解和推理物理世界的模型。与其他模型不同,Newton将实时传感器数据与自然语言融合,提供关于世界的洞察。其应用跨越制造业(监控员工安全和预测设备维护)到分析交通路口以实现更安全的人行横道,以及改善大规模建设工地的安全。
不断增长的能力导致商业应用
过去两年产生了人形机器人的首次商业部署,包括在宝马工厂和GXO物流仓库的部署。2024年6月标志着人形机器人首次部署在商业运营中,Agility Robotics的Digit进入了"劳动力"。
尽管占据了很多头条新闻,人形机器人只代表AI机器人部署的一小部分。目前,协作机器人、机器人手臂和自主移动机器人正在变革仓库和工厂设置。前沿例子是亚马逊公司,它在其仓库中使用智能机器人。在该公司超过75万台机器人中,亚马逊推出了Vulcan,一个具有触觉的AI驱动机器人手臂;Cardinal,堆叠包裹的机器人;以及Proteus,移动推车的自主移动机器人。
"以前也可以做到这一点……但你需要一个高度训练的计算机模型,"戴维森补充道。"现在你可以要求物理或生成式AI模型为你创建,无需任何训练。"
摩根士丹利分析师估计,亚马逊的机器人发展到2030年每年可为公司节省多达100亿美元。这还不包括不断反馈到物理模型中的所有数据的好处,这在行业中可能是无与伦比的。市场分析师Grand View Research的报告估计,2023年全球机器人人工智能市场规模为128亿美元,预计到2030年将达到1248亿美元。
工业机器人在2024年占据了AI机器人市场68%的份额,全球工厂安装基数为428万台。医疗和健康机器人代表增长最快的细分市场,预计增长率为26%,计算机视觉辅助手术系统和自主医院物流机器人快速发展。
然而现实仍然复杂。Tria Technologies软件开发实验室负责人塞德里克·文森特提供了一个冷静的评估:"虽然你可能在网上看到工业机器人搬运箱子的视频……当涉及到人形机器人复制人类活动时,如果你仔细观察,你会看到它们大部分时间都会失败。"
"机器人还不能始终如一地包装产品",因为这需要机器人系统尚未具备的判断力,亚马逊机器人部门机器人引入负责人伊戈尔·佩丹说道。这就是为什么单独的机器人手臂或它们的组合,而不是人形机器人,是当今的最先进技术。
对于强大的AI功能系统,文森特补充说,"到目前为止,需求是在工业机器人上的应用,它们是一个很好的概念验证。你可以在英伟达身上看到这一点,但还没有什么'真正'的东西。"实际上,SiliconANGLE的姐妹市场研究公司theCUBE Research指出,由于物理AI模型还没有大语言模型拥有的庞大数据语料库,它们在类似能力方面可能至少落后两到三年。
演示与部署之间的这种差距解释了为什么,正如戴维森所指出的,企业应该"专注于今天可用的东西,而不是仍在新兴的东西。"
自动驾驶汽车也从物理AI在AI模型和硬件方面的突破中受益,Waabi计划使用其下一代基础模型在今年年底实现完全无人驾驶卡车。Aurora Innovation和Torc Robotics等公司最近也在德克萨斯州的固定路线和美国公共道路上推出了无人驾驶卡车服务的商业试点,为FedEx和Uber Freight等合作伙伴运输货物。
自动驾驶汽车市场反映了这种加速,根据市场分析师Grand View Research的数据,该行业预计将从2024年的680.9亿美元增长到2030年的2143.2亿美元。
英伟达的Drive Thor平台将于2025年在量产车辆中推出,已获得包括奔驰、捷豹路虎、沃尔沃汽车以及中国电动汽车制造商理想汽车、吉利控股的极氪和小米公司在内的主要制造商的采用。该平台将多种车辆功能——从自动驾驶到AI座舱功能——整合到单个片上系统的能力吸引了既有的汽车制造商和机器人出租车公司,如优步科技。
卡车运输领域特别展示了商业可行性。麦肯锡公司预测,到2035年,自动驾驶卡车通过运营成本效益可以创造6000亿美元的市场。普华永道和制造业研究所估计,如果积极采用自动长途卡车运输,制造商到2040年可以节省近30%的总运输成本。
"如果你看今天的人类司机,虽然他们平均可以开11小时,但他们实际上只开6.5小时……突然间(有了自动驾驶)你可以24小时利用你的资产,"乌尔塔松谈到经济学时说道。
即将到来的人机交接
英伟达首席执行官黄仁勋宣布物理AI开启了"AI的新时代",这一大胆宣言现在得到了具体技术突破的支持。英伟达的愿景超越了孤立的自动化,实现了根本性变革。
"大语言和生成模型的进步指向AI的新时代——能够推理物理世界并在工厂、家庭和城市中无缝运行的系统,"英伟达的斯宾塞·黄补充道。"有了可以使用真实或合成数据在模拟中重新训练的'机器人大脑',机器人可以快速学习新技能,并被重新用于广泛的应用。"
这种适应性代表了主导机器人技术数十年的狭窄、预编程系统的地震性转变。
"到2027年,叙述不会是关于人类替代,而是关于增强操作,AI驱动的物理系统作为增强而不是取代人类专业知识的工具,"凯捷Invent的Synapse的AI和数据主管兼负责人马特·吉尔伯特说道。
吉尔伯特补充说,人类劳动将从重复性体力任务转向与智能系统车队一起工作和监督。这一变化的基础将是AI驱动的机器人系统如何处理可变和非结构化环境,这直到最近还是人类工人的专属领域。
"关键的商业差异化因素将是谁具有部署和适应智能的技能,而蓬勃发展的企业将是那些学会了如何快速教授、管理和信任其劳动力机器人组件的企业,"吉尔伯特说道。
劳动力取代问题给物理AI的商业发展蒙上了阴影,尽管早期证据表明现实比世界末日头条所暗示的更加细致入微。世界经济论坛的《2025年就业未来报告》预测,到2030年,AI和自动化将在全球创造1.7亿个新角色,同时取代9200万个,净增7800万个工作岗位。高盛估计,随着AI采用,6%到7%的美国劳动力面临取代风险,尽管影响似乎是"暂时的",因为新机会会出现。对52项工业机器人研究的荟萃分析没有发现广泛工资压抑的一致证据。
对于企业领导者,吉尔伯特将这种转变描述为"增强操作而不是人类替代"。中国200亿美元的人形机器人投资强调了利害关系:该国1.23亿制造业工人面临真正的不确定性,即使官员承诺合作而不是替代。
历史表明这些担忧并非没有根据。从织机到工厂车间的以往自动化浪潮的教训表明,技术取代往往比技术专家预测的要慢,但比工人在没有制度支持的情况下重新培训要快。
这种转变的路径已经制定。斯宾塞·黄观察到,虽然"大多数机器人仍然狭隘地预编程",但新一波公司已经在部署适应性系统。一些公司专注于构建可泛化的"机器人大脑"——英伟达、Field AI和Skild AI——而其他公司开发物理平台本身——Figure、Agility和Universal Robots。
吉尔伯特说,在短期内,两到三年,最直接的价值将来自应用构建者和在高价值用例(如仓库物流)中加速开发的公司,而硬件和平台提供商将缩小潜力与生产之间的差距。从长期来看,超过五年,价值将转向平台提供商和机器人动作、模拟和训练主导基础模型的制造商。
"物理AI的成功将由四个关键因素决定:易用性、可靠性、多功能性和性能,"戴维森指出。
Q&A
Q1:什么是物理AI?它与传统自动化有什么区别?
A:物理AI是将人工智能集成到物理系统中,使机器人和机器能够实时感知、推理并适应现实世界。与遵循僵化编程的传统自动化不同,物理AI系统将复杂算法与传感器和执行器相结合,以应对不可预测的环境并处理可变任务。
Q2:机器人基础模型是如何工作的?
A:机器人基础模型是能够接收信息并使用推理来指导在现实世界中执行的机器人动作的AI软件"大脑"。这些模型通常建立在视觉-语言模型之上,具有多模态能力,能够感知世界并允许机器人识别物体和理解物理学,从而将语言提示转化为具体的机器人动作。
Q3:物理AI会对就业市场产生什么影响?
A:根据世界经济论坛的预测,到2030年AI和自动化将在全球创造1.7亿个新角色,同时取代9200万个,净增7800万个工作岗位。专家认为未来将是"增强操作而不是人类替代",人类劳动将从重复性体力任务转向与智能系统一起工作和监督。
辉煌配资提示:文章来自网络,不代表本站观点。