撰文 / 张 鸥
编辑 / 吴 静
设计 / 师玉超
来源 / CNET,作者:Stephen Shankland
当特斯拉的人形机器人“擎天柱”(Optimus)在2022年AI日上首次亮相时,有不少人都对埃隆·马斯克(Elon Musk)雄心勃勃的计划生起了怀疑。
与谷歌旗下波士顿动力公司(Boston Dynamics)阿特拉斯(Atlas)酷炫的跑酷表演相比,擎天柱的步态显得苍白无力。
但是,不要轻易就否定特斯拉的高科技愿景。
在AI日现场,该公司展示了大量细节内容,充分表明了它正在深入思考人形机器人和使其发挥作用所需的人工智能技术。而且,特斯拉在电动汽车工程和制造方面的许多成就也足够为擎天柱增加一份信心。
在世界首富CEO及其公司强大的资源支持下,特斯拉的工程师们都卯足了劲儿。机器人和人工智能领域的专家也对擎天柱印象深刻。
“自研究生院以来,我从没有如此努力地工作过,我享受我的工作。”一位从事特斯拉Dojo技术的高级芯片设计师说。
特斯拉擎天柱的步行演示视频▼
(来自Twitter:Tesla)
波士顿动力公司的阿特拉斯上演跑酷▼
(来自油管:Boston Dynamics)
不可估量的未来价值
在2021年的特斯拉AI日上,首次亮相的机器人概念只是几张演示幻灯片,以及一个机器人装扮的人类舞者而已。
一年后,第一台特斯拉人形机器人终于亲自走上了舞台。
它由胸前的电脑提供动力,靠一系列闪亮的圆柱形制动器来移动,上面镶有状态LED,并用铜神经系统相连,站在它旁边可以听到冷却风扇的声音。
目前谁都无法预测,这个机器人是否有一天会像马斯克设想的那样,为我们购物或取代在生产线上的工人。这位话题人物表示,第一台擎天柱要在3-5年后才能上市。
如果他的设想成真,擎天柱无疑可以像汽车或智能手机一样彻底改变世界。
“在本十年结束时,这个机器人很有可能成为股价的主要驱动力。”研究机构 New Street Research的分析师皮埃尔·费拉古(Pierre Ferragu)在一份报告中说,“如果擎天柱来自一家初创公司,它的估值可能达到几十亿美元,甚至更多。”
研究公司IDTechEx预计,到2032年,服务类机器人的研究支出将增长近5倍,达到700亿美元。
不可否认的是,从原型到产品往往需要一个漫长的过程。例如,特斯拉的全自动半挂卡车和Cybertruck已经不止一次被推迟上市日期了。
马斯克创造了书呆子的天堂
在大多数人的客观印象里,优秀的工程师都是学生时期的标准书呆子形象——高智商,对古怪而枯燥的研究感兴趣。
而马斯克的超前视野似乎和这些天才们不谋而合。当我们大多数人寄希望于更高级的笔记本电脑和智能手机时,马斯克思考的是想象以上的东西:机器人能够做什么呢?
作为连续创业者,马斯克擅长的不仅仅是选择困难但可实现的业务,他还能够找到愿意接受挑战的优秀工程师,并为他们提供可以大展身手的环境。这可能也是马斯克能够游刃有余地“分心”,推出新公司,收购Twitter,活跃在各个领域的原因。
AI日现场,一位在SpaceX工作的人透露,竞争对手曾多次试图挖走她。然而在她看来,SpaceX颠覆了火箭业务,就像特斯拉颠覆了汽车行业一样。这家公司带给她的挑战是任何其他公司都无法比拟的。
目前,SpaceX是NASA认证的唯一一家太空运输供应商,可以处理载人任务。它基本上已经成为世界上最繁忙的发射供应商。
2022年的特斯拉AI日被明确设定为工程师的招聘活动。一些为特斯拉直接竞争对手工作的人也因为一封招聘邮件而出现在了现场。这些行业从业者们,所怀抱的都是对梦想职业的向往,对未来研究的兴趣,没有人对擎天柱嗤之以鼻。
毫无保留的研究细节
一个名为Bumble-C(擎天柱的未进化版本)的人形机器人同样出现在了AI日的舞台上。它展示了一些诸如挥舞、抽动手臂和弯曲腰部的动作。从某些标准来看,它并不引人注目,毕竟它只是不到一年时间的工作成果。
从左至右:概念、Bumble-C、擎天柱▼
一系列工程师与马斯克同台,详细介绍了他们对机器人的研究:
- 特斯拉正在设计自己的执行器,这些执行器由齿轮、电机、传感器和控制装置紧密组合而成,就像人类的肌肉。该公司正在从设计特斯拉汽车驱动装置的团队中汲取经验。在AI日上,工程师们展示了特斯拉的计算结果,即它是如何为整个机器人创建六个执行器组成的集合,从而最大限度地优化成本,降低制造难度,提高速度、扭矩、质量和效率。
- 特斯拉从人体解剖学中吸取了教训。例如,采用了类似于人类膝盖的复杂的四杆铰链机制,根据膝盖弯曲的程度,调整执行器对力量或速度的不同需求。
- 特斯拉也在使用FSD背后的相同人工智能技术来指导擎天柱。这包括占用网络(occupancy network),这是一个人工智能系统,可以将摄像头的输入数据转换为机器人周围的三维地图。
- 特斯拉正在建立自己的定制数据中心技术–Dojo,以训练进入车辆或机器人的多个人工智能系统。到目前为止,特斯拉已经建立了三个Dojo硬件柜,它已经可以处理视频训练数据,这是过去使用72个Nvidia高端A100处理器的方法无法完成的。
- 在运动方面,Optimus将模拟虚拟机器人的物理模型与衡量机器人实际表现的现实世界传感器数据相结合。步行技术已经越来越成熟:第一步是在2月;擎天柱的骨盆在7月开始摇晃;8月开始,摆动的手臂运动伴随着它的步伐;擎天柱的脚趾在9月首次抬起离开地面。
“特斯拉团队非常领先,对创新技术充满自信,正因为如此,他们才会大大方方地将这些细节分享出来。”费拉古说。
从0开始的AI控制
特斯拉的汽车正在从人类驾驶向全自动驾驶发展。与汽车相比,机器人很显然面临着更高的挑战,它的所有行动都需要人工智能来掌控。
特斯拉在9月份扩大了对FSD的beta测试。美国和加拿大有16万人可以使用▼
(图源:Stephen Shankland/CNET)
如今的人工智能不是用狭隘、僵硬的“如果、这样、然后、那样”等指令对计算机进行编程,而是通过训练系统来识别大量来自真实世界的数据模式。这使得人工智能系统能够处理更复杂的问题,做出更细微的决策。
对于自动驾驶汽车来说,它会遇到不同的情况。即使是同一个十字路口,下雨、正在施工或被一辆停滞的汽车挡住,都会需要截然不同的应对。
特斯拉正在进行大规模投资以克服这些挑战。据一位参加AI日的工程师说,特斯拉每天都会从汽车报告的视频中提取100T大小的数据。它还会模拟各种条件,将人工智能的训练情况扩展到比实际事件更广阔的范围。
机器人遇到的情况可能更加广泛。想一想,两个不同的家庭,生活模式有多么不同。然后在这些家庭情境之外,还有企业、人行道和农场等等。
特斯拉的机器人演示视频设定在一个相对狭窄的领域:他们自己的办公室和研究实验室。马斯克说,该公司计划首先在特斯拉超级工厂中测试它们。
马斯克制造人形机器人的初衷其实有一些含糊。
SpaceX的工作是将人类带到火星,特斯拉电动汽车是为了让我们摆脱污染环境的化石燃料。那么人形机器人呢?这位CEO的解释显得极富机会主义色彩——特斯拉拥有专业知识,所以不妨做一下试试。
他希望这个机器人能够帮助数百万人,将人类从无聊、危险和重复的工作中解放出来。在他的终极设想中,他说:“人形机器人可以带来一个富足的未来,一个没有贫困的未来。人们可以在产品和服务方面拥有任何想要的东西。这是对我们所知的现有文明的根本性转变。”
我们当然不可能很快结束贫困。但这个擎天柱确实已经不仅仅是概念和原型了,它正迈出大步,朝着未来走去。
本文由汽车商业评论原创出品
转载或内容合作请联系说明
违规转载必究