特斯拉人形机器人擎天柱的亮相并没有惊艳到观众,不过其低至2万美元的售价无疑将加快人形机器人的商业化进程。
当地时间9月30,特斯拉第二届ai day(人工智能日)在美国加州帕罗奥图举行。本次活动正如此前外部所预期,特斯拉对广受瞩目的人形机器人、完全自动驾驶功能、dojo超级计算机都做出了详尽的介绍。
完全自动驾驶系统fsd beta即将在今年年底在全球范围内推出,其用户数也从2021年的2000人增加至现在的16万名;dojo超级计算机有望成为世界上最强大的超级计算机之一,预计2023年之前,特斯拉将在美国加州的帕罗奥图建造第一台dojo exapod——利用d1芯片打造的超级计算机集群;擎天柱(optimus)人形机器人无疑是本次ai日的主角,工程师们花了大量篇幅来讲解擎天柱的逻辑、仿生、算法等等,特斯拉ceo埃隆·马斯克的演讲和观众问答也几乎全都围绕擎天柱展开。
擎天柱原型机亮相
作为一场针对ai人才的招聘会,整场发布会充满了晦涩难懂的专业词汇,但这并没有妨碍擎天柱的迅速“出圈”。一经发布,“特斯拉人形机器人原型机亮相”便冲上微博热搜。
有趣的是,社交媒体上不乏“擎天柱就是铁二(小米日前发布的人形机器人名为铁大)”“我们欠铁大一个道歉”等调侃,而在推特上,也有不少人表示,擎天柱难望波士顿动力之项背,“差了一光年”。
擎天柱真的让网友们白白期待一年吗?
软硬件高度仿生:不仅是长得像人
活动刚刚开始,特斯拉就直接亮出了擎天柱原型机。这也是擎天柱首次在没有任何支撑的情况下亮相。
“这实际上是机器人第一次在没有系绳的情况下走上舞台,”马斯克表示,“机器人实际上可以做的比我们向你展示的要多得多,我们只是不希望它掉在你脸上。”
台上的擎天柱行动缓慢,但值得注意的是,擎天柱的仿生并不仅仅是外形和动作上的仿生,在这背后,特斯拉更想通过ai技术赋予其一颗人类的大脑。
特斯拉方面表示,擎天柱的设计基于人体,希望其行为方式和人的行为尽可能接近。正如多年前马斯克坚持自动驾驶应该像人一样使用视觉算法,擎天柱的软硬件设计也都坚持尽量“像人”。
擎天柱配备了2.3kwh电池组,身高约172cm,体重73kg,静坐时能耗100w,慢走时能耗500w,整个身体的自由度超过200多个,其仿生手指非常灵活,拥有27个自由度,且能够自然行走。
从目前披露的数据来看,擎天柱相较于去年的概念机“胖”了不少。在2021年8月的特斯拉ai day上,特斯拉披露,擎天柱机器人身高约172cm、体重约56kg。
下一代擎天柱样品被搬上舞台
擎天柱迭代示意图
特斯拉展示的视频显示,目前,擎天柱可以下蹲、拿箱子、抓取物体,甚至浇花等一系列动作,并且可以部署在特斯拉工厂内进行工作,并能够对行走的路径形成记忆。
此外,擎天柱应用了大量特斯拉汽车的开发逻辑,例如减少零部件数量及复杂程度,将传感器、充电管理、融合计算等汇集到躯干电池组中完成;并根据汽车撞击试验,模拟机器人摔倒场景并保护机器人大脑,即中央计算平台。
在擎天柱的行走能力方面,特斯拉的全自动驾驶系统fsd直接被应用在擎天柱身上,擎天柱采用了与汽车一样的视觉感知,利用摄像头获取数据,以神经网络进行计算。
马斯克:要做“有用的机器人”,售价2万美元
擎天柱究竟要被用于做什么具体事情?特斯拉并没有给出明确答案,不过马斯克反复提到,要把擎天柱做成“有用的机器人”。
浇花、搬运重物、踢足球、陪伴……未来人类有需求的地方,或许都会有擎天柱的出现。对于特斯拉的功用,马斯克其实给出了十分开放的答案。
擎天柱在特斯拉工厂中
前不久,在发表于《中国网信》杂志的文章中,马斯克写道:“特斯拉机器人最初的定位是替代人们从事重复枯燥、具有危险性的工作。但远景目标是让其服务于千家万户,比如做饭、修剪草坪、照顾老人等。”
要到千家万户中去当“有用的机器人”,价格门槛就不能过高。一如特斯拉把电动车的成本打下来,擎天柱也有望借规模效应走入寻常百姓家。
马斯克提到,特斯拉将致力于大规模量产并降低成本,今后擎天柱的产量将达到数百万台,其价格低于特斯拉汽车,预计最终价格不到2万美元。
这一价格让不少人喜出望外,毕竟此前的人形机器人造价昂贵,波士顿动力量产销售的机器狗价格也达到了每只7.5万美元。
在擎天柱身上,依旧可以看到特斯拉对于“经济性”的极致追求。
特斯拉高级机械设计工程师、工程团队成员lizzie miskovetz表示,人类在一些事情上也很有效率,但在其他时候效率不是那么高。虽然人类可以靠一点点食物维持生命活动,但无法在不工作时停止新陈代谢。
“在机器人平台上,我们要做的是将这一点降到最低,尽可能降低闲置功耗,”她介绍,特斯拉团队还计划从机器人的手臂和腿上剥离尽可能多的复杂性和重量,“我们将尽可能减少每个部件的数量和功耗,比如减少四肢的传感器和布线。”
也正是特斯拉对于“经济性”的执着,让机器人服务于人类的日子更进了一步。马斯克提到,未来3-5年内,人们就有可能会收到自己的擎天柱了。据介绍,擎天柱将最先在特斯拉的工厂中进行测试和应用。
相较于擎天柱能够做什么,还有不少人更关注它不能做什么。
有不少人担心擎天柱是否会变成“终结者”、威胁到人类,马斯克表示不会出现这种情况,“我们设计擎天柱时,设计了很多安全屏障。有很大一部分信息保存在本地,你可以按下本地的停止按钮,也可以实现远程控制,这些安全按钮是不可篡改的。”
也正因此,马斯克表示,目前没有考虑将擎天柱开源,“可能会落入坏人之手,用来做一些坏事。”
此外,马斯克还表示,为了提高效率,擎天柱可以不止有两只手,其使用场景是开放的,特斯拉会不断从硬件上逐渐优化擎天柱、为其添加附件,“手机可以不断添加功能模块,擎天柱也可以不断添加。我们希望擎天柱可以形成一个生态。”
亚利桑那州立大学机器人学教授henri ben amor表示,马斯克2万美元的目标价是一个“好提议”,因为目前人形机器人的成本高达10万美元。
不过他也提到:“这种雄心壮志与他们所提出的内容之间存在一些差异。”“说到灵巧、速度、稳定行走的能力等等,还有很多工作要做。”
卡内基梅隆大学机械工程教授aaron johnson评价说,机器人的需求值得商榷。“真正令人印象深刻的是他们如此迅速地达到了这个水平。不过现在仍不确定的是,这数百万个机器人,他们的使用场景将会是什么样的。”
明年推出超级计算机集群exapod
本次ai日上,特斯拉也带来了超级计算机dojo的最新进展。团队称计划在2023年第一季度推出首个dojo exapod,这是特斯拉利用d1芯片打造的超级计算机集群。
dojo为特斯拉自研的多芯片模组化 (multi-chip modularized) 超级计算机,于去年的ai日上亮相。最初dojo主要服务于自动驾驶系统的数据标注以及训练,现在这一技术也被应用于机器人研发,擎天柱的“大脑”中便搭载了dojo d1超算芯片。
d1超算芯片是dojo系统的基础。该芯片采用7纳米制造工艺,处理能力为1024 gigaflops,即每秒1024亿次。单片包含500亿枚晶体管,线路长度高达11英里。
1500枚d1芯片可组成阵列,而将25个阵列放在一块晶圆上,便能形成训练模组 (training tile),这便是dojo超级计算机的单元核心。
dojo exapod由多个dojo机柜链接而成,可被视为dojo集群。exapod内含120个训练模组 (training tile)、3000个d1芯片。其拥有13tb静态随机存取记忆体容量以及1.3tb高传输频宽记忆体容量,算力高达1.1eflop。
exapod数据
特斯拉团队详细介绍了dojo机柜的性能。一个dojo机柜内含两层计算托盘,每个计算托盘含有6个训练模组 (training tile),算力达54 pflops,以100 kw以上电力运作。
6个训练模组
每层训练模组连接着超高速存储系统,构成640gb运行内存、18tb每秒的运算带宽以及,超过1tb每秒的网络传输速度。
特斯拉团队专注提高dojo工作效率,配合专属编译器,同等规模gpu(图形处理器)的训练延迟为150毫秒,而dojo只需5毫秒。 到2023年第一季度,dojo将得到更多优化,单芯片训练速度或达到英伟达a100的4.4倍。特斯拉团队介绍, 通过提高集成度增强dojo效率。但高集成度同时带来了散热问题,若热膨胀系数(cte)过高,系统材料将严重受损。
到2023年,dojo单芯片训练速度或为英伟达a100的4.4倍
为此,特斯拉自研的vrm(电压调节模组),并在两年内迭代14个版本。目前该模组能够使得热膨胀系数(cte)最高降幅达54%。
cte降幅高达54%
fsd年底将在全球开放
自去年dojo超级计算机发布以来,特斯拉fsd的开发进程持续加速。
特斯拉autopilot总监ashok elluswamy提到,通过在北美地区道路接近两年的测试,特斯拉完全自动驾驶系统fsd beta版本目前拥有16万名用户,而2021年时还仅有2000名。
马斯克透露,fsd beta将会在今年年底覆盖全球范围,fsd beta已经可以适用全球所有地区的路况。不过他也提到,在北美之外的地区,特斯拉仍面临着一些监管层面的障碍。
在今年的股东大会上,马斯克就曾透露,特斯拉对fsd做了“一些非常重要的架构改进”,如改进左转时的复杂问题等。他表示,特斯拉目前正在北美广泛部署fsd beta版本,并将在今年启动完全自动驾驶能力(fsd)软件的大规模测试,目前测试版软件的累计行驶里程已经突破4000万英里,年底甚至有望超过1亿英里。
目前特斯拉fsd的识别能力、执行决策都得到了升级优化,fsd beta版已经可以从停车场自动驾驶到另一个停车场,点到点的城市道路自动驾驶。
在难度较大的无保护左转场景,fsd的能力也获得了提升。通过神经网络学习的运用,以及大量的仿真计算和模拟,特斯拉获得了识别周围车辆与行人信息后,计算出合理安全的通过路线轨迹,减速至安全速域并在行人与车辆之间的缝隙通过。
同时,正如擎天柱一样,fsd的决策方式也正在向人类靠近。
特斯拉autopilot运动规划技术负责人paril jain展示了fsd如何在特定的交互场景中有所改进,并可以做出“类似人类”的决策。例如,当特斯拉左转进入十字路口时,它会选择一条不会与行人等障碍物近距离接触的轨迹。
fsd在特定的交互场景中有所改进
此外,在活动的问答环节,马斯克还提到,他目前正在驾驶 fsd beta的alpha 版本,该版本将两个堆栈(城市街道和高速公路)合并起来。
这可能正是业内期待已久的fsd beta v 11。此前就有媒体报道称,fsd beta v11 将是特斯拉首个单堆栈fsd beta版本,其意义在于,fsd beta v11将会是一个完全具备所有驾驶技能的系统,更像一个人类司机。而目前的主流自动驾驶系统是由acc、noa等不同方案叠加而成。
按照马斯克的说法,特斯拉人工智能日的目标依旧是招揽人工智能领域人才。在活动中,马斯克提到,希望更多的人才到特斯拉来享受自己的职业生涯,“在硅谷有很多公司,表面看起来很好,但实际并不是看起来那样。特斯拉不一样,如果你才华横溢,你将在特斯拉获得更多自由。”