【编者按】
“园区恳谈会”以园区为基点,以圆桌对谈方式讨论产业发展问题,持续关注战略新兴产业的当下与未来。我们期待与产业发展主体携手发起议题,深入讨论产业发展的方向与路径,共同助力中国科技创新事业发展。
今年以来,随着人工智能大模型的加速发展,人工智能产业本身也成为了人们关注的焦点。为此,“园区恳谈会”栏目聚焦人工智能的重要应用场景和领域,探讨其中存在的机会与前景,遇到的困难和阻碍,寻求更好的解决方案和政策支持,推动相关产业高质量发展。
主持人:
谷晓丹 澎湃新闻记者
与谈人:
楼天城 小马智行联合创始人兼CTO
杨明 上海交通大学智能网联电动汽车创新中心主任
6月15日,小马智行的一场10小时全无人驾驶直播在北京经开区、广州南沙区同时上演。自动驾驶汽车一路驶过南沙牌坊、蕉门河公园等地标性路段,而南沙,正是小马智行在中国成长的开端。
2017年底,在美国硅谷创业刚满一年的小马智行,因为一次偶然机会得到了南沙在自动驾驶方面的政策支持,于是选择落地南沙发展。在产业链、商业化上,小马智行与广汽、如祺出行等园区主机厂和运营平台合作,也开始在园区布局智慧交通、智慧城市等业务。
小马智行联合创始人兼CTO楼天城被称为 “中国编程第一人”,他在接受澎湃新闻记者视频采访时,使用的是国际编程比赛 Topcoder Open(TCO)ID “ACRush”,采访中,公司员工也以“教主”而非“楼总”称呼这位高管。楼天城毕业于首届清华姚班,师从图灵奖得主、中国科学院院士姚期智。
小马智行联合创始人兼CTO楼天城
“近两三年,自动驾驶行业的发展受到了一些质疑,ChatGPT的出现让这个行业重获关注。” 楼天城在谈到此次全无人驾驶直播时说,“我们希望能借此机会,对外展示中国自动驾驶技术的最新发展。”他表示,直播设备只能坚持10个小时,限制了展示时长,他们计划未来在直播方面,继续扩大自动驾驶汽车数量和区域范围。这也是小马智行为进一步实现商业化的布局,是在用户端所作的一次市场教育,它要让大众以最直观的方式体验到,去掉车里的安全员,真正实现“无人”自动驾驶的那种冲击力。
自动驾驶并不是近年来才出现的新概念,它经历了跌宕起伏的行业变迁,这是一个循序渐进的过程,上海交通大学智能网联电动汽车创新中心主任杨明正是这一领域发展的见证者。
上海交通大学智能网联电动汽车创新中心主任杨明
早在1997年,杨明在清华大学计算机系攻读博士时开始研究自动驾驶,而他的导师中国科学院院士张钹,是一位在中国人工智能、自动驾驶领域的最早研究者。2000年之前,自动驾驶的研究多数侧重高速公路环境,然而杨明却认为,自动驾驶的性能考验不应该局限在对汽车的控制上,环境感知能力同样非常重要。实际上,低速环境对智能感知的要求更高,但相比高速环境更容易落地。
因此,2003年杨明前往法国国家信息与自动化研究所(INRIA)从事博士后工作,开始专注在低速和限定区域的自动驾驶研究。他在接受澎湃新闻记者采访时,展示了一张自己所绘制的图,四个象限基本涵盖了自动驾驶领域所涉及的主要应用场景。这张图以场景难度为纵轴,以速度为横轴,其中无人出租车处于高速、场景难度最大的应用场景,而这恰恰是小马智行主攻的领域之一。
自动驾驶与“无人”
自动驾驶并不完全意味着“无人”参与。汽车工业界对于自动驾驶汽车自动化程度的衡量标准,通常采用汽车工程师协会(SAE International)定义的从0级(完全手动)到5级(完全自主)的6级分级标准。
对于L1级别自动驾驶,可以完成在一个维度(横向或纵向)的驾驶任务;L2级别自动驾驶可以同时自动进行多维度辅助(如加减速和转向);L3级别自动驾驶车辆在特定环境中可以实现自动加减速和转向,无需驾驶人干预;在L4级别自动驾驶中,在限定条件下如果车辆当前处于自动驾驶状态,则全程无需驾驶者接管方向盘;L5级别自动驾驶车辆可以在任何条件、任何场景下自动行驶,车辆的自动化系统完全替代了人类驾驶员,车辆达到完全自动化。
杨明谈到了分级标准可能存在的两大理解误区。首先,分级标准不存在小数点,L2和L3间有着明显鸿沟,牵扯到事故责任归属的问题。如果L2以下系统发生安全事故,驾驶员为第一责任人,而L3的交通事故责任划分,则是横亘于行业发展中的一大困扰。因此很多车厂只推L2的产品,但无论L2小数点后面有几位,它的本质还是辅助驾驶。其次,级别不存在技术差异,划分依据主要是谁来接管,是用户和车的关系,它代表的是用户使用方式的不同,而非自动驾驶水平的高低,因此L4并不代表比L2技术水平高。“其实如果用‘辅助驾驶’称L2更清晰,也不容易造成用户混淆,导致放松安全警惕性,误以为无论在什么场景下都可以‘躺平’,让汽车自动驾驶而无需驾驶员接管。”杨明提醒道。
事实上,目前自动驾驶领域主要有两大技术流派——渐进式和跨越式。前者从先进驾驶辅助系统(ADAS)产品开始生产,并逐步研发到无人驾驶阶段,大部分传统车企和零部件企业一般采用这种相对保守的路线;后者一开始就研发L4或者L5级自动驾驶,如谷歌、福特、通用(GM)、Momenta等公司。
小马智行选择的是“跨越式”路线,也就是L4级的真正“无人”自动驾驶。在楼天城看来,自动驾驶出行服务(Robotaxi)最难,也是最有前景和意义的应用场景,因为它可以改变人们的出行方式,10小时双城无人驾驶直播和自动驾驶卡车(Robotruck)就属于此类,而乘用车智能驾驶则是更容易实现商业化落地的应用场景。
“要想真正实现‘无人’自动驾驶,从行为主义人工智能角度看,关键是使机器与人类的行为相似”。杨明认为,目前无人自动驾驶距离人类司机还有一定差距,尤其在容错能力方面。比如,人类司机观察到各类行人违章过马路时,大多可以及时刹车避碰,但无人自动驾驶汽车由于训练不充分,不一定能够采取正确的驾驶行为。
“无人”不仅对自动驾驶提出了更高的技术门槛,也对车辆的运营服务提出了更多要求。以自动驾驶出行服务为例,这牵扯到运营方为乘客所提供的服务体验质量,它要让用户在平台打车时感到便捷,就像搭乘一般出租车一样,还要能应对乘客想要更换目的地等临时需求,并确保乘客及汽车的基本安全。在没有人类司机的情况下,如何用流程解决这类“无人”所带来的问题还有很多挑战。
产业发展难在落地
7月6日,特斯拉创始人埃隆·马斯克通过视频在2023世界人工智能大会开幕式上预测,今年晚些时候能够实现L4-L5级全自动驾驶,这一言论立马引发业界讨论。对此,杨明持谨慎态度,他认同全自动驾驶是大势所趋,但现阶段自动驾驶最为迫切的问题还是“落地”,要提高公众和产业对这项技术的信任和信心。
在落地方面,楼天城认为小马智行自动驾驶出行服务(Robotaxi)的主要挑战在于成本,需要大规模量产来实现商业化,小马智行正通过与丰田、上汽、一汽、广汽等国内车厂合作来控制成本。不过,如果将自动驾驶出行服务和自动驾驶卡车这两大主要应用场景做比较,楼天城认为在发展方向上并不存在“二选一”的必要。相比而言,尽管卡车的商业模式更容易落地,但技术挑战也较大,由于卡车十倍于乘用车的质量,不允许它在行驶时发生交通事故,因此对于安全性的要求非常高。尽管面临重重挑战,小马智行还是希望在2025年前实现全无人驾驶L4级的规模化、商业化落地,他们也一直在为这一目标而努力。
杨明则在小马智行主要涉及的大规模化场景之外,看到了中、小规模化场景落地的可能性。“与国外相比,中国场景更为丰富。除了大规模场景外,由于国内自身市场庞大,即便是中、小规模场景也足以支撑商业化。”
在杨明看来,过于追求“大规模量产”是阻碍落地的问题之一,大规模量产的场景往往风险高、挑战性大。“开放、高速场景落地的困难之处在于,一旦出事就是车毁人亡。如果短期内不能落地,各方都会失去信心”。杨明表达了他的担忧。
不过从长远看,杨明对自动驾驶领域所涉及的各种应用场景都表示乐观,他认为自动驾驶的未来场景可能是“共享汽车”,园区可能是短期内最容易落地的场景。自动驾驶汽车不仅可以用来载人,还可以应用在车辆管理上,减少运营成本,比如让车辆自行实现空车运输,从而解决生产制造和城市运营的难题。“自动驾驶就像一把钥匙,可以打开共享经济的大门。”
以下是自动驾驶领域发展所面临的几个关键问题:
澎湃新闻:自动驾驶领域面临着什么产业困境?
楼天城:在商业化落地方面,成本问题亟待解决。我们在自动驾驶出行服务(Robotaxi)方面正通过与车厂合作来实现大规模量产,从而达到成本控制。此外,相关产业的成熟度也会影响成本。
杨明:现在自动驾驶最难的就是商业化落地,除了大规模化场景,国内中小规模化场景也可以实现“规模化量产”。无人驾驶智能网联汽车道路测试牌照的发放有利于解决落地问题,但从测试到真正落地之间还存在一段漫长的距离。
澎湃新闻:自动驾驶领域缺乏什么样的人才?
楼天城:自动驾驶领域需要的人才是动态的,在这一快速发展的行业中,保持开放和学习心态非常重要,“1万小时理论”依然发挥作用,需要不断提升自己,分析解决新问题,去做一些新技术。
杨明:产业需要懂技术的人,研发需要懂产业的人,不仅需要创新技术,更需要创新产品。自动驾驶领域需要综合性、创新型、国际化的人才,我们不仅需要算法人才,也需要设计工程师、电气工程师、集成电路工程师等各类人才。因为自动驾驶是一个系统工程,传感器、芯片、操作系统等也很关键,希望政策在基础研究和人才培养上给予更多支持。
澎湃新闻:大模型有可能为自动驾驶产业带来什么机会?
楼天城:我把大模型看作是一种工具,因为真正具有推理和自学归纳能力的AI远远没有到来。我认为AI对于常识和认知的学习能力还需要发展时间,如何将人类的认知注入AI需要突破。目前,大模型在自动驾驶领域的主要应用在道路感知、行为预测、高质量数据的自动标注以及泛化能力等方面。
杨明:大模型有助于自动驾驶的发展,但如何获得“语义”是个难题。一方面,大模型带来了通用人工智能的曙光,未来一套大模型有可能解决自动驾驶所有应用场景遇到的问题;另一方面,大模型有望让自动驾驶开车更像人,现在离这一阶段越来越接近了。