
今年的政府工作报告明确提出,要“培育壮大新兴产业和未来产业”,建立未来产业投入增长和风险分担机制,培育发展未来能源、量子科技、具身智能、脑机接口、6G等未来产业。这是“具身智能”连续第二年被写入政府工作报告。
过去一年,具身智能创业公司不断涌现,头部互联网公司、芯片公司和新能源汽车公司也纷纷加入具身智能“战场”,越来越多风险投资也注入该赛道。具身智能产业加速从技术研发走向规模化落地,2025年前三季度,工业机器人产量达59.5万台,服务机器人产量达1350万套,均超过2024年全年产量。
未来哪些技术突破可能为具身智能产业化按下加速键?具身智能的人才缺口如何补?以及面对急剧变化的人工智能产业,高校与计算机专业的学生应该如何应对?对于这些问题,全国政协委员、中国科学院自动化研究所多模态人工智能系统全国重点实验室副主任王亮接受了《中国报道》记者专访,分享了他对具身智能产业的洞察。

全国政协委员王亮。
“我对这个领域的前景是非常乐观的,但产业化会是一个渐进的过程,把基础打扎实比急于追求短期成果可能更为重要。”王亮说。
身在高校,王亮特别强调产教融合的重要性。他认为,对具身智能来说,高校与产业的深度融合不是可选项,而是学科本身的内在要求。具身智能的研究对象是在真实物理环境中工作的智能系统,学生如果接触不到真实的硬件平台和工程约束,研究就很难具备实际价值。
以下为《中国报道》与王亮的对话实录,有删减。
技术突破的三把钥匙:大模型、世界模型、软硬协同
《中国报道》:不少网友调侃,今年“机器人全面入侵春晚”,宇树科技、魔法原子、银河通用和松延动力4家公司的人形机器人高调亮相春晚。与此同时,马斯克也反复在社交媒体向公众和投资者宣扬,特斯拉公司的人形机器人“擎天柱”将在明年颠覆现状,并有望创造一个新的巨型产业。具身智能产业在多方因素作用下超预期进化,您如何判断具身智能未来的发展方向?哪些技术突破可能会对加速具身智能的产业化进程起到关键作用?
王亮:从我自己的研究实践出发,我认为具身智能正处在从“能力验证”走向“场景落地”的转折点。学术界已经在一些受控环境下证明了智能体可以完成相当复杂的任务,但从实验室到真实场景之间还有较大的距离需要跨越。未来的核心挑战,不仅要让机器人更聪明,还要让它能在真实复杂、不断变化的环境中可靠地工作。
从技术突破的角度,我认为有几个方向的进展对具身智能产业化非常关键。第一是以大模型为基础的通用感知和决策能力。过去我们为每个任务训练专用模型,泛化能力很差,换一个场景就要重新来过。现在借助视觉语言模型等新范式,智能体开始具备跨场景、跨任务的泛化潜力,一旦这个方向取得实质突破,具身智能的应用边界会极大拓宽。
第二是世界模型与物理理解能力。机器人要在真实环境中可靠地工作,必须对物理世界有基本的预测能力:理解物体的材质、重量、运动趋势等。这方面的进展将直接提升系统在复杂场景中的安全性和可靠性。

World Labs产品界面。图源/网络
(注:登上《时代》杂志2025年度封面人物、人工智能先驱之一的华人科学家李飞飞于2024年创立World Labs,致力于“世界模型”的研发。用户使用该模型,仅靠一张图、一句话,就能生成一个完整3D世界。)
第三是软硬件的协同设计。算法的能力上限很大程度上取决于硬件的设计,反过来算法的进展也应该驱动硬件迭代。真正能落地的产品,一定是两者深度耦合的结果。
我对具身智能发展前景的看法是非常乐观的,但产业化是一个循序渐进的过程,把基础打扎实比急于追求短期成果可能更为重要。
人才瓶颈:纵向打不通,横向铺不开
《中国报道》:虽然具身智能的产业规模在加速扩张,有望在2035年突破万亿元。但数据显示,具身智能行业正面临着严峻的复合型技术人才短缺问题,甚至出现了百万年薪难解具身智能“人才荒”的局面。猎聘大数据研究院发布的《2025三季度人才供需洞察报告》显示,具身智能平均招聘年薪高达33.34万元,明显高于人工智能行业的29.09万元。北京理工大学表示,根据调研,当前各行业和单位具身智能人才缺口约100万。根据您的观察和研究,当前具身智能领域的人才缺口和困局体现在哪些方面?
王亮:人才问题是我在教学和研究中感受非常直接的瓶颈问题。个人认为可以从两个维度来理解。一个是纵向的技术深度,也就是软硬件贯通的能力。传统AI人才的培养大多在纯数字环境中完成,但具身智能要求算法最终落在真实的物理实体上运行。现实情况是,做算法的同学往往缺乏对硬件约束的体感,做硬件的同学对最新AI技术又不够熟悉,能在这条链条上贯通的人非常稀缺。
另一个是横向的场景宽度,也就是技术与行业深度结合的能力。具身智能的价值要在制造、医疗、家庭服务等具体行业中兑现,但每个行业都有独特的流程逻辑和安全规范。缺乏对行业纵深的理解,技术方案往往只能停留在“能演示”的阶段,很难真正通过客户的验收。这类复合型人才成长周期长,很难完全靠校内培养完成。这两个维度的人才缺口是相互关联的:纵向打不通,技术出不了实验室;横向铺不开,产品进不了行业。
《中国报道》:为加快适应产业发展,不少高校近一年增设“具身智能”专业。2025年,教育部陆续公布了申请增设“具身智能”“具身智能工程”新专业的9所高校,其中包括北京航空航天大学、北京理工大学、上海交通大学等。其中,上海交通大学设立具身智能四年制工学本科专业,依托人工智能学院计算机类学科体系。从人才培养角度来看,具身智能与人工智能在知识体系构建和能力要求上有哪些共通之处?又有哪些本质上的不同?
王亮:二者在数理基础、编程能力、深度学习等核心理论与方法上都是共享的,二者的核心差异在于思维模式的转变。人工智能的思维习惯是“数据进、数据出”,关注离线指标的表现;具身智能则要求学生时刻意识到算法在真实物理世界中运行,每一个决策都有物理后果,很多时候不可逆。这种从“信息空间思维”到“物理空间思维”的跨越,仅靠课堂讲授很难完成,需要学生在真实的硬件系统中反复历练。
围绕真实工程问题来组织教学,推动产教深度融合
《中国报道》:面对巨大的产业需求,高校在具身智能人才培养上应做出哪些调整?
王亮:我认为具身智能的人才培养不能简单地在现有AI课程体系上做加法,而是要围绕真实的工程问题来组织教学,让学生在解决问题的过程中自然地整合不同学科的知识。
高校应通过构建跨学科的培养体系,让学生形成复合型的知识结构;强化学生的工程实践能力,为学生提供更多接触真实具身智能体硬件和实际工程问题的机会,而不仅仅停留在仿真和论文层面;注重人才梯队的合理建设,如本硕博贯通式教育,既要培养能做原始创新的研究型人才,也要培养能把技术落到实处的工程应用型人才。
尤其在推动产教融合方面,对具身智能来说,高校与产业的深度融合不是可选项,而是学科本身的内在要求。
从我的观察来看,很多校企合作仅仅停留在企业出资、高校出论文的阶段,双方在问题定义上并没有真正对齐,有效的合作应该是围绕真实的技术瓶颈共同攻关。
要让学生有实质性进入产业场景的机会,不是参观式的实习,而是深度参与到工程项目的完整周期中。这种经历对学生的成长价值,远超课堂上的模拟训练。具身智能的研究对象是在真实物理环境中工作的智能系统,学生如果接触不到真实的硬件平台和工程约束,研究就很难具备实际价值。
此外,在人才培养环节,高校要更加注重激发年轻人的问题意识和独立思考能力,让他们不仅善于跟进学科前沿,更有勇气去定义新的基础问题。在具身智能领域,我们在应用层面积累的大量真实场景经验,实际上正在催生很多新的基础研究问题,这是我们未来提升原始创新能力和攻关关键核心技术的优势所在。
找到能力“锚点”,持续深耕
《中国报道》:从大语言模型到如今的具身智能,AI领域的技术热点快速迭代,各类模型与产品层出不穷。您观察到身边的学生面对人工智能工具的快速迭代,是否存在心态上的焦虑或压力?这种背景下,虽然我们强调持续学习的重要性,但在计算机相关专业中,是否存在一些能力的“常量”及相对稳定的核心素养?对于学生如何适应一个AI工具不断涌现的时代,您有何建议?
王亮:坦率地讲,焦虑和压力是存在的。大语言模型兴起之后,不少同学发现自己精心设计的模型和方法,可能被一个通用大模型直接覆盖掉了。过去需要专门训练才能解决的任务,现在通过提示词就能完成。
到了具身智能阶段,类似的焦虑也在发生,同学们会担心自己当前的研究方法很快被新范式替代。一个博士生的培养周期一般是五年,但一个技术范式的更迭有时只需要一两年,有时甚至更快,这种节奏上的错配,是焦虑的重要来源。
但我经常跟学生讲,焦虑的根源往往不是技术变化本身,而是对自身能力“锚点”的不确定。如果核心竞争力建立在某个特定框架或模型上,确实容易被冲击;但如果建立在更深层的基础之上,情况可能就完全不同。
所以我认为教育中确实存在需要坚守的“内核”。第一是扎实的数理基础。我经常跟学生分享一个现象:每一轮看似全新的技术浪潮,当你沉下心去研究其最核心的论文时会发现,底层撬动问题的杠杆仍然是经典的数学工具。数理功底扎实的学生面对新范式时,适应速度远快于只熟悉特定工具的同学。
第二是科研方法和能力的训练。现在很多学生能熟练调用开源模型、复现论文算法,但在独立定义问题、设计实验、分析实验失败原因等方面仍存在不足。我常对学生说,一个实验跑出了好的数字不代表你理解了它为什么好,一个方法失败了也不代表这个方向没有价值,关键在于能不能严谨地分析和验证。
第三是对真实应用场景的理解力。我鼓励学生多去实际应用场景中看一看,了解真实的需求和瓶颈问题,这种经验是看多少论文都替代不了的。
在技术快速迭代的当下,我的建议是,要把AI工具当作能力的放大器而不是替代品,用大模型辅助工作没有问题,但前提是你自己要有判断质量的能力。同时,要有定力在一个方向上持续深耕。真正做出有影响力研究的年轻学者,往往不是追热点的人,而是在一个问题上深耕数年、建立起系统性认知的人。
此外,关注国家在具身智能、人形机器人等方向上的战略部署,把个人的研究兴趣与真实的产业需求结合起来,这样研究的价值根基会更扎实,发展方向也会更清晰。
文:《中国报道》记者 李士萌
责任编辑:柴晶晶
版权所有 中国外文局亚太传播中心(人民中国杂志社、中国报道杂志社) 举报电话: 010-68995855 举报邮件: chinareport@foxmail.com 法律顾问:北京岳成律师事务所
广播电视节目制作经营许可证:(京)字第07311号 互联网出版许可证:新出网证(京)字 189号 京ICP备14043293号-10 京公网安备:110102000508