正在阅读:

人形机器人,多少年才能演完“返老还童”?

扫一扫下载界面新闻APP

人形机器人,多少年才能演完“返老还童”?

科幻正一步步迈入现实。

文 | DoNews  小不董

编辑 | 李信马

科技圈整个10月最大的争议事件之一,可能就是特斯拉的人形机器人了。

2022年10月1日上午,在全世界期待了一年之后,最后出现在屏幕面前的,却是步履蹒跚的“垂垂老朽”,演示也仅仅是打了个招呼,并没有回答问题或者跳舞,裸露的线路和电池给人一种刚从实验室拉出来的感觉。

去年的AI Day上,特斯拉人形机器人的展示视频中,是一位灵活的的机器人舞者。也因此,小米的CyberOne(铁大)首次亮相后,被观众们群嘲其走路姿势像裹脚老太太,可以被特斯拉的机器人扶着过马路。但没想到,真实的特斯拉的人形机器人Optimus(擎天柱)却也远没达到观众们的预期。

不过这丝毫没有影响特斯拉CEO埃隆·马斯克的兴致,马斯克在AI Day现场表示,有信心以非常低的成本来实现机器人的量产,并且产量应该可以达到数百万台,最终价格会不到2万美元。 

这一台目前看起来还很简陋的人形机器人,真的能推动行业的变革吗? 

在优必选科技副总裁、人形机器人创新中心负责人付春江看来,还真有这个可能。

目前人形机器人的技术相关路线分成三个范式:第一是以本田Asimo为代表的简化模型位置控制,其特点是利用简化模型节约算力;第二是波士顿动力Atlas的动力学控制,以及后期发展的高速 WBC全身内控的相关算法,特点是实时优化;第三是美国敏捷机器人公司人形机器人Digit强化学习的范式,其特点是可以补偿弹性连杆的没有建模的相关属性。 

付春江认为,基于其实时性与通用性,特斯拉的擎天柱很有可能创造第四范式,即基于大规模神经网络的通用视觉决策运动控制。 

在AI Day的这次展示中,擎天柱所演示的场景有三个:浇花、搬箱子和工厂零部件的移动,分别代表家庭服务、物流递送和工厂装配,每做一件事情都有相应的一整套流程。

付春江告诉DoNews:“这三个场景在现实的开发难度其实是反过来的,随着场景从结构化到非结构化,从静态到动态,首先会实施的是在工厂里边,因为工厂的环境以及所使用的零部件的尺寸,都可以有相应数据输入到机器人当中,这个是相对比较结构化的。第二个场景就是在物流递送方面,从这开始它的环境就逐步开放了,随着环境的动态性、开放性以及任务的复杂性,最后才能到家庭服务场景。先在自己(特斯拉)的工厂里面去布置人形机器人,用途是为了快速积累数据与迭代调试。”

付春江认为,特斯拉有庞大的、先进的FSD自动驾驶平台作为基础,随着它的大规模数据和网络的建立,以及在它自身工厂场景部署数据采集,特斯拉的未来迭代速度会超过大家的预期。 

一、FSD:车能用,机器人也能用 

FSD(Full Self-Drive),即“完全自动驾驶”。

人形机器人想要有能力在物理世界中移动并且具备一定程度的智能,那其“大脑”就需要做到人类大脑能做的,比如能够处理视觉数据,发出动作指令,还要支持通信,擎天柱的大脑就是特斯拉的人工智能系统。

机器视觉作为一种底层通用技术,可以扩展到手机、摄像头、自动驾驶汽车、机器人等诸多产品形态,在铁大的视觉系统上,就用了很多小米手机的图像处理能力。而擎天柱头部会装配特斯拉车同款的智能驾驶摄像头,具备与特斯拉车相同的视觉感知能力,可以说在机器视觉算法上,擎天柱与特斯拉汽车的FSD一脉相承。

特斯拉结合自动驾驶的视觉处理和传感技术,可以确保机器人保持良好的姿态和步态,同时对人类相关的动作进行关键帧分析,再用算法映射到机器人,做到更好的轨迹规划。 

此外,特斯拉在汽车自动驾驶领域的自研芯片、软件算法、训练模型以及其超级计算机Dojo的AI算力,都可以支持到特斯拉人形机器人,这是擎天柱其相较于其它人形机器人的核心优势。比如特斯拉的机器人使用了单颗特斯拉自研的SoC芯片,而并非特斯拉在汽车上使用的双芯片自动驾驶方案。 

下图中,特斯拉的研发人员最近正在训练人形机器人的计算机视觉识别高频特征,让人形机器人能够快速找到最近的充电站。 

图片来源:特斯拉

软件上的优势固然重要,不过当下机器人最需要解决的问题,可能还是集中在硬件上,对此,付春江也表示:“就硬件水平来讲,特斯拉与世界领先的人形机器人是没有代差的。” 

二、硬件:性价比高,可以量产 

目前业界运动能力最强的人形机器人,非波士顿动力Atlas莫属,但其成本之高也令人咋舌。而特斯拉显然是希望打造一款足够灵活但又性价比高,能够大量生产的人形机器人,这也是这款产品的初衷——替代人类去做大量重复性的工作。

要达到这个目标,就像电动汽车一样,首先要能“续航”。从擎天柱的概念图中可以看到,整个机器人包含了28个电动驱动器(橙色标注)和电池及控制模块(蓝色标注)。特斯拉将配电和计算机集中到平台的物理中心,也就是机器人的躯干中心,身体中间有2.3kWh的电池组,工作电压为52V,其中的电池组可以维持它一整天的工作,其目标就是尽量减少每个元件的数量和功能损耗。

电池组的独特之处在于,可以把所有电池的电子设备集中到电池组内的单个PCB里面,这就意味着从传感到融合到充电管理,全都汇集到这一个系统中。这项技术借鉴了特斯拉在电子产品和汽车上的设计,电池组只有实现真正高效简单的冷却,才能确保良好的电池管理和安全性。

其次,是足够灵活且耐用。完全体的擎天柱体重73kg,用电功率在静坐时为100W,快走时500W,全身有200多个自由度,手部27个自由度。机器人在研发过程中,受到了生物学的启发,以机器人腿部关节为例,就是仿照了人类膝盖的真实结构。

研发人员将人类的膝盖和其运动过程中所受的力线性化,比如说行走,上楼梯下蹲,它的关节会呈现什么样一个压力曲线,从而学习如何让机器人膝盖使用更少的力来构建,能实现更好的力度控制的同事,也让相关结构紧密的包裹在膝盖周围。

在爬楼梯、攀岩或步行时,要考虑机器人关节所承受的压力,研发人员将不同的参数录入优化程序和优化模型中,以求机器人适应不同的场景。

执行器的效率图生成了相关轨迹,以点云的形式进行记录。机器人的每个关节都是特定的,28个关节都需要定制规格。因此,研发人员需要减少定制的执行器设计,解析它们上传的云并采取共性研究。特斯拉展示了擎天柱在极限情况下所能达到的测试效果,其关节驱动器能吊起一架半吨重的钢琴。

同样采用了生物学的还有机械手,和人手一样同样使用五个手指来驱动,既可以完成大口径物体抓取,同时也能满足抓取精巧物体的需求。特斯拉的人形机器人手指有6个执行器和11个自由度,搭载了能够驱动手指并进行感知的传感器。

图片来源:特斯拉

在安全性和可靠性方面,特斯拉也做了不少的设计。由于一台机器人的维修成本很高,所以为了保护机器人,研发人员对其结构基础进行了优化,在人形机器人摔倒时不会把变速器和胳膊弄坏。

研发人员还采用了与汽车相同的底层技术,让机器人在所有组件中产生压力,使得其行走控制变得更加容易,也不会那么僵硬。

今年4月份,擎天柱的移动速度还很慢;今年7月,人形机器人解锁了骨盆的应用来保持平衡;8月时,手臂开始发挥作用;到9月份,擎天柱的脚趾也利用了起来,擎天柱的移动速度有了明显的提升。一年的时间,软硬件升级过后的擎天柱,就这样出现在了我们眼前。

虽然现在还显得笨拙,但这样的不断进步是有其价值的,比如人形机器人可能最早落地的场景——工厂,目前自动化程度已经很高了,但是总装线的自动化率依然较低,细碎轻巧的任务基本是靠人工,那么人形机器人正好能够弥补这个空白,在移动中实现装配。

“人形机器人在B端的应用,与常见的机械臂、物流机器人相比,是在中短距离的移动范围内,用双臂和灵巧手完成的序列化的工作。比如需要快速更换不同工具,需要多种对象的动态任务序列等等,这些都是与机械臂和物流机器人可以打出差异化来的。”付春江说。

三、人形机器人什么时候能真正投入实用?

工厂更期待的是二十出头的年轻劳动力,而非七老八十的“老年机器人”。

“我个人认为研发和量产,是人形机器人最终走向落地、走进千家万户非常关键的一步。但从过去的这种Demo级来看的话,量产还存在运动能力不达标、成本居高不下、缺乏落地场景这三个非常大的困难。”付春江感慨道。

优必选科技同样是全球优秀的人形机器人科技公司,旗下人形机器人Walker X也开始在科研开发和科技展馆、影视综艺、商演活动、政企展厅等商用服务领域实现落地应用,做出了人形机器人商业化尝试的示范案例,未来有望走进千家万户,在家庭服务场景中使用。

在场景落地方面,优必选科技进行了超过1000小时无故障的实际场景落地演练工作,在付春江看来,人形机器人现在是相当于iPhone1的阶段,还处于快速发展的开端。“随着大手企业的不断进入,对赛道的不断加码,会有大量的上游零部件企业,比如电机检测、器厂、传感器厂、结构加工厂会得到相关益处,质量、数量方面都会有所增加。另外下游的场景开发的针对性的这些厂商,数据服务厂商等等,甚至是第三方运维交付的厂商都会有很大的发展。”

在成本方面,优必选科技是全球第一个实现大型人形机器人BOM成本降至十万美元级别的公司。付春江表示,国产人形机器人在量产加国产化之后,至少在动力系统方面可以下降50%,算力系统可以有15%-25%的下降,而结构及外观可以有40%甚至更多的下降,“在2025年左右,我认为人形机器人的成本可以降到5万美元,或者是再稍微高一点的程度”。

而特斯拉大量沿用来自车端的成熟技术,再加上偏量产实用性的设计思路,使得擎天柱的生产成本具备极大的优势。除量产以外,还可以通过国产化替代,或者国产的二线厂商随着技术水平进步替代国产一线厂商,以及改进生产工具,减少相关零部件,还有用更鲁棒的运动控制算法来降低对硬件精确度及硬件指标的要求来降低成本。如果能结合以上4点,付春江估计特斯拉会在2025-2030年之间,实现2万美元的相关成本。

人形机器人想要走进千家万户,首先要能以较高的完成度去完成消费者和社会的需求,其次是成本和通用AI的发展,最后还少不了人形机器人的易用程度,例如能够开箱即用和售后维护,这些都是人形机器人未来产品化过程中不可或缺的。

显然,这不是短期能达到的,但我们依然可以看好其未来的成长性,马斯克在活动期间发的推文,透露擎天柱机器人将会有“猫女版”,可以看出,特斯拉对于人形机器人抱有强烈的信心,随着更多的资本进入赛道,特斯拉入局有望推动行业从实验室阶段过渡到商业化阶段, 人形机器人的发展未来可期。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

人形机器人,多少年才能演完“返老还童”?

科幻正一步步迈入现实。

文 | DoNews  小不董

编辑 | 李信马

科技圈整个10月最大的争议事件之一,可能就是特斯拉的人形机器人了。

2022年10月1日上午,在全世界期待了一年之后,最后出现在屏幕面前的,却是步履蹒跚的“垂垂老朽”,演示也仅仅是打了个招呼,并没有回答问题或者跳舞,裸露的线路和电池给人一种刚从实验室拉出来的感觉。

去年的AI Day上,特斯拉人形机器人的展示视频中,是一位灵活的的机器人舞者。也因此,小米的CyberOne(铁大)首次亮相后,被观众们群嘲其走路姿势像裹脚老太太,可以被特斯拉的机器人扶着过马路。但没想到,真实的特斯拉的人形机器人Optimus(擎天柱)却也远没达到观众们的预期。

不过这丝毫没有影响特斯拉CEO埃隆·马斯克的兴致,马斯克在AI Day现场表示,有信心以非常低的成本来实现机器人的量产,并且产量应该可以达到数百万台,最终价格会不到2万美元。 

这一台目前看起来还很简陋的人形机器人,真的能推动行业的变革吗? 

在优必选科技副总裁、人形机器人创新中心负责人付春江看来,还真有这个可能。

目前人形机器人的技术相关路线分成三个范式:第一是以本田Asimo为代表的简化模型位置控制,其特点是利用简化模型节约算力;第二是波士顿动力Atlas的动力学控制,以及后期发展的高速 WBC全身内控的相关算法,特点是实时优化;第三是美国敏捷机器人公司人形机器人Digit强化学习的范式,其特点是可以补偿弹性连杆的没有建模的相关属性。 

付春江认为,基于其实时性与通用性,特斯拉的擎天柱很有可能创造第四范式,即基于大规模神经网络的通用视觉决策运动控制。 

在AI Day的这次展示中,擎天柱所演示的场景有三个:浇花、搬箱子和工厂零部件的移动,分别代表家庭服务、物流递送和工厂装配,每做一件事情都有相应的一整套流程。

付春江告诉DoNews:“这三个场景在现实的开发难度其实是反过来的,随着场景从结构化到非结构化,从静态到动态,首先会实施的是在工厂里边,因为工厂的环境以及所使用的零部件的尺寸,都可以有相应数据输入到机器人当中,这个是相对比较结构化的。第二个场景就是在物流递送方面,从这开始它的环境就逐步开放了,随着环境的动态性、开放性以及任务的复杂性,最后才能到家庭服务场景。先在自己(特斯拉)的工厂里面去布置人形机器人,用途是为了快速积累数据与迭代调试。”

付春江认为,特斯拉有庞大的、先进的FSD自动驾驶平台作为基础,随着它的大规模数据和网络的建立,以及在它自身工厂场景部署数据采集,特斯拉的未来迭代速度会超过大家的预期。 

一、FSD:车能用,机器人也能用 

FSD(Full Self-Drive),即“完全自动驾驶”。

人形机器人想要有能力在物理世界中移动并且具备一定程度的智能,那其“大脑”就需要做到人类大脑能做的,比如能够处理视觉数据,发出动作指令,还要支持通信,擎天柱的大脑就是特斯拉的人工智能系统。

机器视觉作为一种底层通用技术,可以扩展到手机、摄像头、自动驾驶汽车、机器人等诸多产品形态,在铁大的视觉系统上,就用了很多小米手机的图像处理能力。而擎天柱头部会装配特斯拉车同款的智能驾驶摄像头,具备与特斯拉车相同的视觉感知能力,可以说在机器视觉算法上,擎天柱与特斯拉汽车的FSD一脉相承。

特斯拉结合自动驾驶的视觉处理和传感技术,可以确保机器人保持良好的姿态和步态,同时对人类相关的动作进行关键帧分析,再用算法映射到机器人,做到更好的轨迹规划。 

此外,特斯拉在汽车自动驾驶领域的自研芯片、软件算法、训练模型以及其超级计算机Dojo的AI算力,都可以支持到特斯拉人形机器人,这是擎天柱其相较于其它人形机器人的核心优势。比如特斯拉的机器人使用了单颗特斯拉自研的SoC芯片,而并非特斯拉在汽车上使用的双芯片自动驾驶方案。 

下图中,特斯拉的研发人员最近正在训练人形机器人的计算机视觉识别高频特征,让人形机器人能够快速找到最近的充电站。 

图片来源:特斯拉

软件上的优势固然重要,不过当下机器人最需要解决的问题,可能还是集中在硬件上,对此,付春江也表示:“就硬件水平来讲,特斯拉与世界领先的人形机器人是没有代差的。” 

二、硬件:性价比高,可以量产 

目前业界运动能力最强的人形机器人,非波士顿动力Atlas莫属,但其成本之高也令人咋舌。而特斯拉显然是希望打造一款足够灵活但又性价比高,能够大量生产的人形机器人,这也是这款产品的初衷——替代人类去做大量重复性的工作。

要达到这个目标,就像电动汽车一样,首先要能“续航”。从擎天柱的概念图中可以看到,整个机器人包含了28个电动驱动器(橙色标注)和电池及控制模块(蓝色标注)。特斯拉将配电和计算机集中到平台的物理中心,也就是机器人的躯干中心,身体中间有2.3kWh的电池组,工作电压为52V,其中的电池组可以维持它一整天的工作,其目标就是尽量减少每个元件的数量和功能损耗。

电池组的独特之处在于,可以把所有电池的电子设备集中到电池组内的单个PCB里面,这就意味着从传感到融合到充电管理,全都汇集到这一个系统中。这项技术借鉴了特斯拉在电子产品和汽车上的设计,电池组只有实现真正高效简单的冷却,才能确保良好的电池管理和安全性。

其次,是足够灵活且耐用。完全体的擎天柱体重73kg,用电功率在静坐时为100W,快走时500W,全身有200多个自由度,手部27个自由度。机器人在研发过程中,受到了生物学的启发,以机器人腿部关节为例,就是仿照了人类膝盖的真实结构。

研发人员将人类的膝盖和其运动过程中所受的力线性化,比如说行走,上楼梯下蹲,它的关节会呈现什么样一个压力曲线,从而学习如何让机器人膝盖使用更少的力来构建,能实现更好的力度控制的同事,也让相关结构紧密的包裹在膝盖周围。

在爬楼梯、攀岩或步行时,要考虑机器人关节所承受的压力,研发人员将不同的参数录入优化程序和优化模型中,以求机器人适应不同的场景。

执行器的效率图生成了相关轨迹,以点云的形式进行记录。机器人的每个关节都是特定的,28个关节都需要定制规格。因此,研发人员需要减少定制的执行器设计,解析它们上传的云并采取共性研究。特斯拉展示了擎天柱在极限情况下所能达到的测试效果,其关节驱动器能吊起一架半吨重的钢琴。

同样采用了生物学的还有机械手,和人手一样同样使用五个手指来驱动,既可以完成大口径物体抓取,同时也能满足抓取精巧物体的需求。特斯拉的人形机器人手指有6个执行器和11个自由度,搭载了能够驱动手指并进行感知的传感器。

图片来源:特斯拉

在安全性和可靠性方面,特斯拉也做了不少的设计。由于一台机器人的维修成本很高,所以为了保护机器人,研发人员对其结构基础进行了优化,在人形机器人摔倒时不会把变速器和胳膊弄坏。

研发人员还采用了与汽车相同的底层技术,让机器人在所有组件中产生压力,使得其行走控制变得更加容易,也不会那么僵硬。

今年4月份,擎天柱的移动速度还很慢;今年7月,人形机器人解锁了骨盆的应用来保持平衡;8月时,手臂开始发挥作用;到9月份,擎天柱的脚趾也利用了起来,擎天柱的移动速度有了明显的提升。一年的时间,软硬件升级过后的擎天柱,就这样出现在了我们眼前。

虽然现在还显得笨拙,但这样的不断进步是有其价值的,比如人形机器人可能最早落地的场景——工厂,目前自动化程度已经很高了,但是总装线的自动化率依然较低,细碎轻巧的任务基本是靠人工,那么人形机器人正好能够弥补这个空白,在移动中实现装配。

“人形机器人在B端的应用,与常见的机械臂、物流机器人相比,是在中短距离的移动范围内,用双臂和灵巧手完成的序列化的工作。比如需要快速更换不同工具,需要多种对象的动态任务序列等等,这些都是与机械臂和物流机器人可以打出差异化来的。”付春江说。

三、人形机器人什么时候能真正投入实用?

工厂更期待的是二十出头的年轻劳动力,而非七老八十的“老年机器人”。

“我个人认为研发和量产,是人形机器人最终走向落地、走进千家万户非常关键的一步。但从过去的这种Demo级来看的话,量产还存在运动能力不达标、成本居高不下、缺乏落地场景这三个非常大的困难。”付春江感慨道。

优必选科技同样是全球优秀的人形机器人科技公司,旗下人形机器人Walker X也开始在科研开发和科技展馆、影视综艺、商演活动、政企展厅等商用服务领域实现落地应用,做出了人形机器人商业化尝试的示范案例,未来有望走进千家万户,在家庭服务场景中使用。

在场景落地方面,优必选科技进行了超过1000小时无故障的实际场景落地演练工作,在付春江看来,人形机器人现在是相当于iPhone1的阶段,还处于快速发展的开端。“随着大手企业的不断进入,对赛道的不断加码,会有大量的上游零部件企业,比如电机检测、器厂、传感器厂、结构加工厂会得到相关益处,质量、数量方面都会有所增加。另外下游的场景开发的针对性的这些厂商,数据服务厂商等等,甚至是第三方运维交付的厂商都会有很大的发展。”

在成本方面,优必选科技是全球第一个实现大型人形机器人BOM成本降至十万美元级别的公司。付春江表示,国产人形机器人在量产加国产化之后,至少在动力系统方面可以下降50%,算力系统可以有15%-25%的下降,而结构及外观可以有40%甚至更多的下降,“在2025年左右,我认为人形机器人的成本可以降到5万美元,或者是再稍微高一点的程度”。

而特斯拉大量沿用来自车端的成熟技术,再加上偏量产实用性的设计思路,使得擎天柱的生产成本具备极大的优势。除量产以外,还可以通过国产化替代,或者国产的二线厂商随着技术水平进步替代国产一线厂商,以及改进生产工具,减少相关零部件,还有用更鲁棒的运动控制算法来降低对硬件精确度及硬件指标的要求来降低成本。如果能结合以上4点,付春江估计特斯拉会在2025-2030年之间,实现2万美元的相关成本。

人形机器人想要走进千家万户,首先要能以较高的完成度去完成消费者和社会的需求,其次是成本和通用AI的发展,最后还少不了人形机器人的易用程度,例如能够开箱即用和售后维护,这些都是人形机器人未来产品化过程中不可或缺的。

显然,这不是短期能达到的,但我们依然可以看好其未来的成长性,马斯克在活动期间发的推文,透露擎天柱机器人将会有“猫女版”,可以看出,特斯拉对于人形机器人抱有强烈的信心,随着更多的资本进入赛道,特斯拉入局有望推动行业从实验室阶段过渡到商业化阶段, 人形机器人的发展未来可期。

本文为转载内容,授权事宜请联系原著作权人。