沈住氣、聚合力,敢擔當、抓緊幹!…
7月27日,由广汽研究院人工智能首席科学家陈学文领衔的X Lab团队在国际权威的Argoverse 2运动预测挑战赛中,依靠自主研发的运动轨迹预测框架XPredFormer,斩获运动轨迹预测榜单全球第一,展现广汽自动驾驶技术强大实力。这是继2022年8月广汽自主研发的XTracker方法在nuScenes自动驾驶测试竞赛中夺得纯视觉榜单全球第一后,广汽自动驾驶技术再次取得创新突破。
(Argoverse 2运动预测挑战赛排行榜,广汽XPredFormer名列运动轨迹预测榜单全球第一)
運動軌迹預測具有重要作用
對交通參與要素運動的精准預測(如:行人的行爲預測、車輛的行駛軌迹預測等)是自動駕駛汽車安全運行的重要前提,這也成爲決定自動駕駛汽車能否融入交通系統、從而構建智慧交通體系的關鍵。運動預測精度是自動駕駛系統高階智能的最直接體現,對行駛的安全性與舒適性起到決定性作用。然而,由于現實路況的複雜性與預測任務固有的不確定性,運動預測一直是自動駕駛的一大難點。
Argoverse 2运动预测挑战赛的权威性
參與者涵蓋業內知名頭部企業。近年来,因运动轨迹预测的重要意义与巨大潜力,越来越多的知名企业如Waymo、华为、阿里巴巴、深动科技等已经开展了相关研究,并参与到Argoverse 2运动预测挑战赛。
賽事數據集的權威性國際公認。本赛事采用的Argoverse 2 Motion Forecasting Dataset,是当前国际公认的权威自动驾驶运动预测公开数据集之一,其数据采集自不同城市2000+公里,共计760+小时的真实道路驾驶场景,提供了丰富的几何形状(车道线等)和语义信息(可行驶区域等)共计250000个极具挑战性的复杂场景数据样本。
賽事評比指標制定科學而關鍵。該挑戰賽采用多模態軌迹預測與評價模式,要求預測模型根據交通參與者的狀態和環境信息,預測出交通參與者最多6條未來6秒運動軌迹及其對應概率,並以brier-minFDE作爲模型預測效果的關鍵指標,該指標綜合考量了算法的預測距離誤差和概率准確性。
廣汽研究院如何做到行業第一
广汽研究院X Lab团队自主研发的运动轨迹预测框架XPredFormer,brier-minFDE关键指标达到1.77,处于行业第一。具体实现方式如下:
首先,通過Agent-Encoder和Lane-Encoder兩個Transformer模塊分別提取場景中交通參與者的曆史軌迹運動學特征和複雜的車道拓撲關系特征;其次,利用Transformer-Interaction模塊的Cross-attention機制分別對場景中的動靜態元素建模多尺度交互特征;最後,通過Transformer-Decoder模塊輸出高斯混合模型表示多模態預測軌迹及其對應概率。
(廣汽XPredFormer框架示意圖)
廣汽運動軌迹預測領域的技術突破
廣汽自主研發的運動軌迹預測框架XPredFormer整體上有三大技術突破:
一是實現了預測精度大幅提升。模仿人類駕駛過程中的觀察注意力機制,分別設計了動態、靜態、交互態3個獨立的Transformer特征提取模塊,以實現交通場景的細粒度理解,從而實現預測精度的巨大提升。
二是實現了出色的移植魯棒性和推理速度。以業務落地需求爲出發點,完全自主研發的Transformer輕量級網絡,實現了通過單次推理預測場景中全部Agent軌迹的機制,解決了業務上模型推理時間長、落地難的痛點,具有出色的移植魯棒性和推理速度。
三是具有良好的適配應用條件。XPredFormer具有良好的平台適配與泛化性,可針對不同算力硬件平台進行算法定制化適配,實現預測速度與精度的完美平衡,有效縮短了産品化周期。
关于广汽研究院X Lab团队
广汽研究院X Lab团队成立于2022年,是一支由全球人工智能顶级专家陈学文领衔、以纯视觉路线为主的世界前沿自动驾驶全栈自研团队,全面布局自动驾驶算法、软件集成、仿真测试等领域,致力于实现全场景的无人驾驶,将无人驾驶技术惠及人类出行。团队现有研发人员100多人,成员专业背景多样。成立一年多以来,团队已在泊车和行车领域取得突破性进展。
此次广汽研究院在运动预测领域取得突破性进展,增加了新技术落地量产的可行性。同时,加上在视觉感知领域的先进技术,使打造更加前沿的自动驾驶视觉系统成为可能,目前各项新技术已在泊车、行车领域为量产前进行试验测试。下一步,广汽研究院X Lab团队将继续探索实践运动轨迹预测框架XPredFormer以及其他视觉感知新技术在自动驾驶应用场景的产品化落地,为用户提供低成本的自动驾驶方案,助力自动驾驶行业发展。