93 车用人工智能 特斯拉,2022—2023年
3个月前 作者: [美]沃尔特·艾萨克森
93车用人工智能特斯拉,2022—2023年
达瓦尔·史洛夫和他在特斯拉的办公桌
向人类学习
达瓦尔·史洛夫对马斯克说:“它就像ChatGPT,不过是用在车上的。”他将自己在特斯拉做的项目与OpenAI刚刚发布的人工智能聊天机器人进行比较。OpenAI是马斯克在2015年与山姆·阿尔特曼共同创办的实验室。近10年来,马斯克一直在研究各种形式的人工智能,包括自动驾驶车辆、Optimus和Neuralink脑机接口。史洛夫的项目涉及最新的机器学习前沿领域:设计一种能从人类行为中学习的自动驾驶车辆系统。史洛夫说:“我们处理了大量有关真人在复杂驾驶环境中如何行动的数据,然后我们训练计算机的神经网络来模仿这种行为。”
马斯克要求会见史洛夫,因为马斯克正在考虑说服他离开特斯拉的自动驾驶团队,去推特工作。他曾偶尔与詹姆斯、安德鲁和罗斯并肩作战,充当第四名“火枪手”。史洛夫希望说服马斯克相信他正在研究的项目至关重要,他不想去推特工作。在被称为“神经网络路径规划”的特斯拉自动驾驶软件中,他研究的是“向人类学习”的组成部分。
他们安排会面的这一天发生了太多事情,如果这次会面也是当天“剧本”中已经写好的一部分,那未免显得太刻意了。2022年12月2日,周五,也就是马特·泰比发布第一批“推特文件”的那天。当天上午,史洛夫按照要求来到推特总部,但马斯克刚从内华达州的Cybertruck发布会上赶回来,所以他向史洛夫道歉,他忘了自己还要飞往新奥尔良与马克龙总统会面,讨论欧洲的内容审核规定。他让史洛夫当天晚上再来。在等待马克龙时,马斯克给史洛夫发了信息,把他们的会面时间又往后推了:“我要推迟四个小时,你介意再等等吗?”也正是在那时,他突然给巴里·韦斯和内莉·鲍尔斯发信息,让她们当晚飞到旧金山来与他见面,帮着处理“推特文件”。
马斯克在当天深夜返回旧金山后,终于有机会与史洛夫坐在一起。史洛夫解释了他正在研究的神经网络路径规划项目的细节。他说:“我认为继续完成我手头的工作非常重要。”听了他的话,马斯克再次对这个项目产生了很大的兴趣,同意让他留任。马斯克意识到,未来特斯拉将不仅是一家电动车公司或清洁能源公司,凭借全自动驾驶系统、Optimus和能够完成机器学习的Dojo超级计算机,特斯拉将成为一家人工智能公司:不仅要在聊天机器人的虚拟世界中运营,还要在围绕着工厂和道路环境的现实世界中运营。他已经在考虑聘请一批人工智能专家与OpenAI展开竞争,特斯拉的神经网络路径规划团队将对他们的工作起到补充作用。
多年来,特斯拉的自动驾驶系统一直依赖基于规则的算法。该系统从车辆摄像头获取视觉数据,识别车道标记、行人、车辆、交通信号及8个摄像头范围内的所有事物,再应用一系列规则,比如红灯停、绿灯行、保持在车道线标记正中、不越过双黄线闯入对面车道、通过交叉路口时保证其他车辆的行驶速度不足以撞上我方车辆。特斯拉的工程师手动编写并更新了数十万行C++代码,以便将这些规则应用于更复杂的情况。
史洛夫正在做的神经网络路径规划项目将把这套系统提升到新的层面。他说:“我们不再只根据规则确定车辆的正确行驶路线,而是通过神经网络来确定车辆的正确行驶路线。”换句话说,这是对人类的模仿。面对某种情况,神经网络会根据人类在数以千计的类似情况下所做的事情规划路径。这就像人类学习一切行为的方式一样——说话、开车、下棋、吃意大利面……我们可能会被赋予一套需要遵循的规则,但我们主要是通过观察其他人的做法来掌握这些技能。这是艾伦·图灵在1950年发表的论文《计算机器与智能》中设想的机器学习方法。
特斯拉拥有世界上用于训练神经网络的最大的超级计算机之一,它由人工智能计算公司Nvidia的图形处理器(GPU)驱动。马斯克在2023年的目标是逐渐过渡到使用Dojo,Dojo是特斯拉从零开始打造的一款超级计算机,它使用视频数据训练人工智能系统,拥有特斯拉人工智能团队内部设计的芯片和基础架构,每秒近800亿亿次浮点运算的处理能力,使其成为世界上服务于这一目标的最强大的计算机。它将用于自动驾驶软件和Optimus。马斯克说:“把它们放在一起工作非常有意思,它们都在努力为这个世界指引前进的方向。”
到2023年年初,神经网络路径规划项目已经分析了从特斯拉客户车辆上收集的1000万帧视频画面。这是不是意味着它只能达到人类驾驶员的平均水平呢?史洛夫解释说:“不,因为我们只在人类处理各类情况处理得还不错的时候才使用他们的数据进行学习。”纽约布法罗的人类标记员会对视频进行评估并给出分数。马斯克让他们找出“Uber五星司机会采取的做法”,而这些视频就是用来训练计算机的。
马斯克经常在特斯拉位于帕洛阿尔托的大楼里走来走去,自动驾驶工程师坐在开放的工作区里,他会半跪在他们身旁,即兴讨论一些问题。有一天,史洛夫向他展示了他们取得的进展。马斯克对此印象深刻,但他有一个疑问:是不是真的需要这种全新的方法呢?会不会有点儿矫枉过正呢?马斯克的一句座右铭就是:永远不要用导弹打苍蝇,你应该用苍蝇拍。为了处理一些不太可能发生的、边边角角的极端情况,用神经网络来规划路径会不会是一种过于复杂的方式呢?
史洛夫向马斯克展示了神经网络路径规划比基于规则的方法更有效的实例。演示中的道路上到处都是垃圾桶、倒下的交通锥筒和散落的杂物。在神经网络路径规划的引导下,车辆能够绕过障碍物,越过车道线,并在必要时打破一些规则。史洛夫告诉马斯克:“当我们从基于规则的算法转向基于神经网络的路径算法时,这种情况就会发生,即使在混乱的环境中,如果你打开了这项功能,车辆也不会发生碰撞。”这种跨越到未来的感觉让马斯克兴奋不已。他说:“我们应该做一次像007系列电影场面的酷炫演示,四面八方都有炸弹爆炸,不明飞行物从天而降,而这辆车飞速驶过,不会撞到任何东西。”
机器学习系统在进行自我训练时通常需要一个目标或指标作为指导。马斯克在管理时喜欢通过下命令的方式来决定哪些指标最重要,于是他给了他们一个标准:特斯拉全自动驾驶车辆在没有人类干预的情况下能够行驶的里程数。“我希望每次开会的第一张幻灯片都能展示每次干预前自动行驶里程的最新数据。”马斯克说,“如果训练人工智能,我们应该优化什么?答案是提高两次干预之间的行驶里程数。”他告诉他们,要像打游戏一样,每天都能看到自己的得分。“没有分数的电子游戏是无聊的,所以每天看着单次干预前的里程数增加就会很有干劲儿。”
团队成员在工作区安装了85英寸的巨大显示屏,实时显示完全自动驾驶车辆在没有干预措施的情况下平均行驶了多少英里。每当他们看到某一类干预措施再次出现,比如驾驶员在变道、并线或转弯进入复杂路口时抓住了方向盘,他们就会同时与规则团队和神经网络路径规划团队通力合作,对这一问题进行修复。他们在办公桌附近放了一面锣,每当他们成功解决了一个导致干预出现的问题,他们就敲一次锣。
人工智能试驾
2023年4月中旬,是时候让马斯克测试一下这项新的神经网络路径规划技术。史洛夫和自动驾驶团队安排了一辆试验车,它能让一个用神经网络训练的软件模仿人类驾驶员的操作,软件中只有最基础的传统规则代码。马斯克就坐在这辆车里,开始在帕洛阿尔托兜风。
马斯克坐在驾驶座上,旁边坐的是特斯拉自动驾驶软件总监阿肖克·埃卢斯瓦米。史洛夫和团队的另外两名成员马特·鲍赫和克里斯·佩恩坐在后排,这三个人在特斯拉的办公桌相邻,已经共事了8年,他们在旧金山的住处也相距不远。一般同事的办公桌上会摆一张同家人的合影,而这三个人的桌上都放着同一张他们仨在万圣节派对上的合影。詹姆斯·马斯克曾是这个小团队的第四名成员,埃隆·马斯克接管推特后,把他调了过去,而史洛夫逃过了这一劫。他们驶离特斯拉的帕洛阿尔托办公大楼的停车场前,马斯克在地图上选了一个目的地,点击“完全自动驾驶”按钮,随后双手离开方向盘。试验车拐上主干道时,第一个可怕的挑战出现了:一名骑车人朝他们迎面而来。“我们都屏住了呼吸,因为骑车人的行为很难预测。”史洛夫说。但马斯克毫不在意,也没去抓方向盘,车就自己避让了过去。史洛夫说:“感觉就跟人类驾驶员做出的判断一样。”
史洛夫和他的两名队友详细解释了他们的完全自动驾驶软件是怎么用特斯拉用户的车载摄像头收集的数百万个视频片段进行训练的,结果是这样做出来的软件堆栈比人类编程规定好数千条规则的传统堆栈要简单得多。史洛夫说:“它的运行速度快了10倍,可以直接删掉30万行代码。”鲍赫说这就像人工智能机器人在玩一款非常无聊的视频游戏,马斯克笑了起来。后来当这辆试验车能在车流中自如穿梭时,他就掏出手机发起了推文。
有长达25分钟,这辆车一直在快速路和街道上行驶,完成了一些复杂的转弯,避开了各种骑车人、行人和宠物。马斯克一直没有碰方向盘,只有几次他认为车辆操作过于谨慎时,才会轻点加速踏板进行干预,比如在看到四向停车标识时。这辆车的其中一次操作,马斯克觉得比他自己做的还要好,他说:“哇,连我这脑袋里的神经网络都搞不定这种情况,但它竟然做得很不错。”他非常高兴,吹起了莫扎特《G大调第13号弦乐小夜曲》的口哨。
“干得太棒了,伙计们!”马斯克最后总结,“让我大开眼界。”随后他们一起去参加了自动驾驶团队的周例会,20个人围坐在会议桌旁,几乎都穿着黑色T恤,他们准备接受马斯克的“审判”。很多人不相信这个神经网络路径规划项目能成功,但马斯克宣布他现在彻底相信了,他们应该调集大量资源来推进这个项目。
在讨论过程中,马斯克抓住了团队发现的一个关键事实:神经网络至少得经过100万个视频片段的训练才能达到良好的工作状态,如果训练量达到150万个视频片段,它就相当理想了。与其他车企和人工智能公司相比,这给特斯拉带来了巨大的优势。特斯拉在全球的保有量接近200万辆,每天能收集几十亿帧视频画面。埃卢斯瓦米在会上说:“我们在这方面有着得天独厚的优势。”
不管是自动驾驶汽车、Optimus,还是类似ChatGPT的机器人,收集并分析大量实时数据信息流的能力对各种形式的人工智能都至关重要。马斯克现在有两个强大的实时数据采集器:一个是自动驾驶车辆拍摄的视频,另一个是全球推特用户每周发布的数十亿条推文。马斯克在自动驾驶会议上说他刚刚又买了1万个GPU数据处理芯片供推特使用,他还宣布要更频繁地召开会议,大家要讨论特斯拉正在设计的、可能变得更加强大的Dojo芯片。另外,他难过地承认在圣诞节期间冲动地把萨克拉门托数据中心“大卸八块”是他犯下的一个错误。
列席旁听会议的是一位人工智能领域的超级明星工程师,马斯克在那一周刚刚招募了他,他要为马斯克即将启动的一个新的秘密项目效力。