今天,特斯拉的第二届 AI Day 终于正式召开了。
AI Day 是特斯拉的年度活动之一,其他的固定活动还包括 Battery Day、Autonomy Day,顾名思义就是专门面向AI、电池技术和自动驾驶相关的活动。
今年的 AI Day 拖延了一个多月。上个月马斯克透露,跳票是为了多留点时间,这样在 AI Day 上就能展示可用的人形机器人“擎天柱”(Optimus) 了。
果然马斯克没让大家失望:
我们看到了擎天柱的原型产品(代号似乎是 Bumbleseed) :
为了吸引眼球,马斯克甚至还提前放出消息:未来一定会有“猫女”版擎天柱机器人……
开发仅8个月,已具独立行动能力
不理那些噱头,先来看原型机器人究竟有多厉害。
这台代号 Bumbleseed 的原型机器人,没有去年我们在 Tesla Bot 假人上见到的外壳,所有的内部非关键零部件都裸露在外:
原型机器人身高大约5英尺8英寸(约173cm),体重73公斤。
它在感知和计算的部分基本采用的是特斯拉电动车相同的设备,包括 特斯拉自主研发的芯片集成系统作为“大脑”,以及三颗 Autopilot 级别摄像头。
另外,去年设计 Tesla Bot 的头部还有一块显示屏,能够显示对于用户/工作伙伴有用的信息。这个设计在今天并没有任何进展可以宣布。这是因为团队在过去一年时间里主要在专注解决运动(locomotion),而不是应用软件的问题。
原型机器人的行走速度还很慢,似乎远没有达到去年宣称的每小时5英里(大约8km/h)水平。
至于搬运能力,它可以搬运大约20磅(约10kg)重的中小型货物,比如快递纸盒。这个载荷比去年宣布的少了一半。
擎天柱全身共有28个电机“关节”,比去年宣布的时候的40个减少了四分之一。这是因为电机越少功耗越低。
在坐姿待机状态下,机器人的全系统功耗只有100W,还不到当今主流显卡的一半;而在走路的状态下,整个功耗也只有500W。
马斯克和机器人团队成员一再强调,让机器人更省电是非常重要的设计理念,因为特斯拉的终极目标是大规模生产人形机器人,并且在各种工业、民用场景里投放使用,量级在百万甚至千万级。
下图中蓝色的是电子系统。橘色部分是电机。
先来看电子系统部分:
机器人的设计电池容量为2.3千瓦时,电压52V;机器人的“大脑”部分并不是真的放在脑袋里,而是安装在了躯干位置(因为这里更加安全,并且集成度越高越省电);
机器人在网络连接方面支持 Wi-Fi 和 LTE,并且包括音频组件,都安装在躯干上。
再来看机运动能力。
特斯拉机器人团队成员透露,他们用了一套和电动车碰撞安全测试相同的预测模型,来提前预测机器人在各种姿势下,在执行正常工作时候的表现,以及预测可能导致机器人受损(比如摔倒和遭遇攻击)等各式各样的情况。
然后,工程团队对收集到的各种工况数据,通过微积分方式进行了大量的模拟,从而微调电机的工作功率,从而将能耗降到最低;另外,他们还从不同的电机数据中找到共性,从而降低不同型号电机的使用。
最终全身的28个电机当中,只有6种不同的设计,显著降低了机器人批量生产的成本。
这些电机当中,有载荷能力极强的大电机,足以轻松提起一台三角钢琴的重量;也有手部微小但灵敏的小电机,不仅能够抓住有一定重量的货物,也可以精确地抓握小零件、操作较为精密的工具仪器等。
当然,除了用数学解决问题之外,设计师也加入了一些仿生学的设计。比如机器人的膝盖关节分为4个子电机,和人类膝盖关节/韧带构成类似。
去年马斯克曾经说过,人形机器人的使命,是替代人类去完成危险、重复和无聊的工作。
它的初步设想是让用户可以对它提出简单的命令,比如“把灯泡装上去”之类的,它就可以执行。公司对于擎天柱的定位是“泛用型 AI 机器人”,说白了就是苦力机器人。人机智慧型交流并不是它的设计能力之一。
特斯拉虽然有种种问题,但不可反驳的是,这家公司能够走到今天,靠的真就是对科技创新的疯狂追逐,和马斯克本人强烈的、谁都无法阻挡的意志。去年还有很多人怀疑特斯拉到底是真的要造机器人,还是跟大家开玩笑。结果今年,马斯克还真没有食言。
也许在未来的某一天,擎天柱真的可以取代特斯拉在全球各地的汽车制造工厂里面的工人——他们的工作确实危险、重复且无聊。
去年马斯克还曾表示,这台机器人不会跑的太快,“我们的设计指标是让你可以轻松地不被它追上,并且有很大的几率制服它。”
“最好这种情况不会发生,但谁知道呢。”他补充道。
从去年只有一个假人可以展示,到今年已经有可以独立运行的原型机,特斯拉人形机器人团队在6-8个月极短的时间里已经取得了非常长足的进展,自己已经对团队的成果非常满意。
接下来几周到几个月的时间里,特斯拉还会继续组装出更多的机器人,投入到真实的工业场景(比如特斯拉自己的加州 Fremont 工厂)里进行测试,从而进一步优化设计。
令人兴奋的是:这台机器人从构思,到已经生产出可以在没有任何外部支持(电源线、防护架等支援装置)的基础下,可以自由移动的原型机。
这一情况的重要性在于:尽管今天的原型机器人,距离波士顿动力的 Atlas 在技术上还有很大差距,特斯拉的开发速度却明显更快。
去年 AI Day 上马斯克曾经表示,“特斯拉已经是世界上最大的机器人公司之一了……我们的汽车其实就是带轮子的智能机器人。”
而通过擎天柱项目,特斯拉终于把公司在机器人、传感、AI 等技术上的多年研发积累,从从四个轮子,转移到两条胳膊两条腿的人形机器人上了。
一位团队成员表示“我们有自信可以在未来几年内实现人形机器人的大规模生产。”
马斯克指出,现在市场上的人形机器人,普遍没有智能的大脑,并且成本太高、产量太低。
而特斯拉的长期目标,是将人形机器人的生产成本降低到两万美元左右——还不到一台特斯拉电动车的价格。
“我们还有很长的路要走。所以今天我们办这个活动就是希望更聪明的人加入进来,让可用可靠的人形机器人成为现实,并且足够规模化,能够帮助到数百甚至上千万人。”
Dojo 超级计算机
从2019年,特斯拉在内部启动了一个神秘的项目 Project Dojo,开发采用自研芯片,可以无缝连接,实现超大规模分布式计算的多芯片模组化 (Multi-Chip Modularized) 超级计算机。
这台超级计算机,就是在去年 AI Day 上展示的 Dojo。
Dojo 核心是特斯拉自主研发的 D1 处理器,采用台积电7纳米制程工艺,单片包含500亿枚晶体管、11英里的线路长度。处理器采用了特斯拉自定义的指令集,FP32算力达到22.6TFlops,设计功率400W左右。
但是和处理器的 I/O 带宽相比,算力并没有那么重要。这是因为目前自动驾驶计算平台的主要限制不是算力,而是数据传输,而这台超级计算机正是想要解决这一问题,加快对真实世界的快速感知、计算和数据传输,从而显著改进自动驾驶模型的训练性能。
去年特斯拉宣称 Dojo 所采用的的 D1 处理器的片外带宽远高于谷歌 TPU 和其他科技公司的 GPU-based 分布式计算阵列。
超高的片外带宽尤为关键,因为对于特斯拉而言,D1 Chip 不是一枚一枚用的,而是可以多枚组成一个计算阵列。比如25枚组成一个训练模组 (Training Tile),成为了 Dojo 的单元核心,高达36TB/s 带宽,达到9PFlops 算力。
去年特斯拉透露已经完成了对训练模组的工作测试,成功运行了前特斯拉AI部门总监 Andrej Kaparthy 开发的 minGPT 模型。而在过去的一年里,特斯拉持续对 Dojo 进行优化研发。
在今天的 AI Day 上,Dojo 团队宣称一个训练模组的机器学习训练算力,足以达到6个“GPU 计算盒子”,并且成本还不到“一个盒子”的水平。
这还没完:6台训练模组组合为一层,两层叠在一起为一个训练矩阵(单机柜)
再把机柜链接起来,能够形成“完全体”,也即 Dojo 计算集群 ExaPod,包括120个训练模组、3000枚D1处理器,FP16算力高达1.1 EFlops。
在此之前,Dojo 系统主要是服务特斯拉内部使用,比如路测数据标注、模型训练、运行模拟以及硬件在环任务等。
但更重要的是:Dojo 本质上是一个 ASIC 属性的计算设备,也就可以被看作是一个通用型的神经网络训练设备,也是可以提供给其它机构使用的。
也许在不远的未来,我们可以看到特斯拉不只是电动车/清洁能源公司,还是机器人公司、芯片公司,甚至……云计算公司?
*注:封面图来自于特斯拉,版权属于原作者。如果不同意使用,请尽快联系我们,我们会立即删除。
,