具身智能:工业场景或率先落地,发展仍面临多维度挑战︱2025潜力赛道展望
2025-01-22 16:52:31
  • 0
  • 0
  • 0

随着人工智能的快速发展,能够给机器人带来颠覆性改变的具身智能被寄予厚望。

具身智能是基于物理身体(智能体)进行感知和行动的智能系统,通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为与适应性。具身智能与人工智能的发展息息相关,IDC认为,具身智能是将人工智能融入各类物理本体形成的智能系统。

全球范围内,具身智能被视为一条极具空间和高成长性的蓝海赛道。目前,小鹏、特斯拉等新能源车企,智元机器人、银河通用、星动纪元、宇数科技、傅利叶等国内初创企业在具身智能机器人领域已取得显著成果,华为、阿里、美团、百度等互联网大厂也纷纷入局,具身智能已成为产业链公司明确的发力方向。

具身智能三大功能:感知与交互、自决策、自学习

目前在智能工厂所应用的机器人,更多是在完成一些自动化任务。比如,机械臂需要部署在特定的环境,完成一个任务时,其实是在执行自动化工程师写好的代码并进行调校后的指令,是在完成一些规则的、固定的行动路线,比如抓举等操作,可能会辅以计算机视觉等技术,但始终是“换汤不换药”。而具身智能有别于此,具备感知与交互、自决策、自学习三大功能。

东土科技人工智能研究院院长祝一蒙告诉第一财经,“在大模型问世后,我们现在做的具身智能是通过一个大语言模型去解析用户的自然语言命令,再通过一个视觉语言模型去观察机器人周围的环境,通过这两个模型直接把用户的自然语言命令转化成机器人要执行的动作。”

这就涉及到具身智能的感知与交互功能。具身交互指的是智能体在物理或模拟空间中与人类和环境进行交互,需要具有主动的认知、语言理解能力、目标驱动的探索、常识推理并将自然语言的信息整合到动作序列中,大语言模型在其中起到关键作用。

具有感知能力的智能体必须在物理世界中移动并与环境互动,这就需要对三维空间和动态环境更加了解。与仅仅识别图像中的物体不同,业内认为,未来具身感知的主要发展方向是以智能体为中心的视觉推理,上述“视觉语言模型”也为此类。

“比如我和机器人说一句‘把这杯水放到手机的左边’,以前需要自动化工程师拿一个示教器去告诉这个机器人把这杯水放过去要经历哪些路径点,每走到一个路径点时要用什么样的速度和加速度,包括每个关节用什么样的力矩,然后走过去。但是现在我们可以通过自然语言直接告诉他任务,后面的路径规划和运动控制,都交给大模型去自动完成。”祝一蒙对第一财经解释称,这就是具身智能的自决策。

具身智能机器人企业中科光电创始人、董事长吴易明对第一财经表示,在具身智能下,大脑基于眼睛感知能力,指挥机械手做不同工件,不是识别工件(标记信息)后根据人为不同工件设定好的不同工件的程序执行任务,而是有眼睛感知到工件后,基于自主理解的任务要求,智能分析工件的结构,各要素空间关系,再自主生成工艺、动作和各种运动参数,甚至进行交互和迭代,实现自主作业。“这样的机器人就类似于一个熟练工,拿到了工件的图纸,知晓任务目标就能干了。”

最初这个熟练工仅具备两年经验,而在工厂应用两年后,通过大模型的自学习能力,具身智能机器人能够成长为一个四年甚至更长经验的工程师。这就是具身智能的自学习特点。

人形机器人是具身智能终极方案之一,工业场景或率先落地

人形机器人被认为是具身智能的绝佳载体。

2024年一批人形机器人进入商用测试阶段,目前科研教育场景是人形机器人的主要应用场景。IDC预计,2025年人形机器人将在商用服务、特种作业领域从事运动速度、节拍要求较低的生产服务任务,预计将实现千台量级的小规模商用。

“人形机器人是机器人+端侧AI非常好的应用,也是建立物理世界和大模型连接桥梁的比较好的载体,它是个很优的终极方案之一,但不是最终极的方案。”某具身智能机器人初创企业联合创始人对第一财经表示,“就像人的很多运动特性和感知能力不如部分动物,人形机器人是目前所处物理环境的一个友好方案之一。”

事实上,具身智能并不局限于人形或机械臂等,而是可以根据具体应用场景来选择合适的物理形态。任何能够在物理空间环境中行动并形成互动的机器人,如协作机器人、移动机器人、商用服务机器人等,通过融合人工智能技术、软件产品,都有望发展成为具身智能机器人。也就是说,具身智能机器人的关键在于具身智能的底层技术,而非机器人的物理形状。

“具身智能机器人能够像人一样自主使用传统工具,比如你要砸钉子,我就可以找到榔头,我能认识榔头,像人一样抓榔头去砸钉子。能够像人一样使用传统工具,所以就能够操控机床等其他设备,这就是整个机器人的适用范围,把它做成人的样子,它就是个人形机器人。”吴易明表示。

业内认为,工业领域或是具身智能机器人率先应用落地的场景。

前小鹏机器人产品设计负责人孙兆治此前表示,产线或者工业环境相对来说能够做到结构化或者半结构化,而讨论较多的养老环境或家务环境其实是一个非结构化的环境,它的corner case会非常多,技术成熟到应对这些场景之前,可以优先落地到半结构化场景或者结构化场景,相对来说在产线上或者工业应用相对可控一些。

上述具身智能机器人初创企业联合创始人也有类似观点。“工业和有限范围、有边界条件、非开放型的场景会率先应用。工业应用场景的每个节拍都很清晰,在训练过程中能够有的放矢地进行原子动作,以及建立基于不同垂类领域的原子动作体系。预计2025-2026年,在一些简单场景,包括搬运、分拣等,具身智能机器人都能够做一些事情。而对服务娱乐领域这种高泛化性的人机交互场景,需要机器人八面玲珑,对它的算法要求也更高,这种情况的应用可能会更晚一些。”

具身智能发展面临多维度挑战

具身智能机器人产业链主要包括硬件、算法与模型、数据、算力等方面,其性能表现高度依赖于软件与硬件的全方位进化。作为新兴技术,具身智能的发展也面临着多维度挑战。

硬件是一切的基础。具身智能产业链需要稳定供给的高性能硬件,否则无法根据算法和数据进行硬件的快速优化和修改。“硬件方面,关节、本体领域国内做得还是不错的。我们的部分产品可能在某些性能上与国外存在差距,但现有的工业机器人、协作机器人等都奠定了硬件基础。”上述联合创始人表示。

算法方面,该人士认为,国内外起跑线差不了太多;端侧算力领域,华为等很多企业正在奋力追赶。

数据也是困难的环节之一。机器人与物理世界的感知与交互,所需要积累应用的数据也多源于物理世界,高质量的数据是训练高性能具身智能机器人的基础。

以工业领域为例,工业环境复杂,数据难以积累与有效打通,给AI在工业领域的渗透带来了阻力。“AI需要行业数据的训练,以对行业和领域加深了解。但工业数据的采集比较困难,目前任何一个行业都没有相对规范的标准,同时数据采集过程中也经常会有‘噪音’,数据的有效性难以保证,这也给AI实际应用效果打了折扣。此外,工业领域往往会涉及更多数据安全相关问题,这也给AI应用在工业领域带来了困难。”祝一蒙告诉第一财经。

目前,行业正在通过联盟、跨界合作与建设开源数据集等方式,共同构建高质量、大规模的具身智能数据集,解决数据稀疏和碎片化的问题,同时促进降低研发成本,加速技术迭代,促进生态繁荣。

从投资角度看,头部人形机器人的本体研发集成厂商已经经历多轮融资,估值较高,行业整体投资热点正从人形机器人本体向具身智能模型和其它上游零部件迁移。总体而言,具身智能赛道有望继续成为市场投资热点,第一财经也将持续保持关注。

来源: 第一财经资讯

 
最新文章
相关阅读