经典电视剧高清无广告播放网站 ,av免费网站_高清全集在线观看

科研動(dòng)態(tài)

基于多種圖神經(jīng)網(wǎng)絡(luò)和Transformer的車(chē)輛軌跡預(yù)測(cè)方法

中文題目:基于多種圖神經(jīng)網(wǎng)絡(luò)和Transformer的車(chē)輛軌跡預(yù)測(cè)方法

論文題目Multiple Graph Neural Networks and Transformers for Vehicle Trajectory Prediction

錄用期刊/會(huì)議:中國(guó)自動(dòng)化大會(huì) CAA A類(lèi)會(huì)議)

錄用時(shí)間:2024.9.18

作者列表

1) 楊   潔 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 控制科學(xué)與工程 研22級(jí)

2) 劉建偉 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 自動(dòng)化系 教師

摘要:

在復(fù)雜的交通場(chǎng)景中,根據(jù)周?chē)缆肥褂谜叩男袨楹侠硪?guī)劃自己的前進(jìn)路線對(duì)于自動(dòng)駕駛汽車(chē)十分重要。為了更好的解決這一問(wèn)題,本文提出了一種新穎的基于多種圖神經(jīng)網(wǎng)絡(luò)和Transformer的車(chē)輛軌跡預(yù)測(cè)模型(MGNformer)。MGNformer中用于提取時(shí)空特征的編碼器主要由空間交互感知模塊(SIPM)和時(shí)間依賴(lài)感知模塊(TDPM)構(gòu)成,其中SIPM中包含多尺度超圖神經(jīng)模塊(MHM)和圖注意力模塊(GAM),可以從不同維度上捕獲軌跡數(shù)據(jù)中的空間交互特征,TDPM中通過(guò)使用可變形自注意力機(jī)制可以捕捉軌跡數(shù)據(jù)中時(shí)間維度上的長(zhǎng)距離依賴(lài)關(guān)系。考慮到車(chē)輛意圖對(duì)于未來(lái)軌跡的影響,本文額外設(shè)計(jì)了意圖-軌跡融合模塊,將車(chē)輛的意圖概率與軌跡特征向量相融合來(lái)獲取具有更加豐富信息的融合嵌入,將其饋入解碼器中生成未來(lái)軌跡,以此提高軌跡預(yù)測(cè)的準(zhǔn)確性。我們?cè)趦蓚€(gè)公開(kāi)的真實(shí)車(chē)輛軌跡數(shù)據(jù)集上對(duì)MGNformer進(jìn)行了評(píng)估。實(shí)驗(yàn)結(jié)果表明,MGNformer在NGSIM數(shù)據(jù)集和HighD數(shù)據(jù)集上的RMSE降低了5.49%/16.67%,達(dá)到了預(yù)期結(jié)果。

背景與動(dòng)機(jī):

近年來(lái),智能化的自動(dòng)駕駛汽車(chē)因其無(wú)需駕駛員操縱的特點(diǎn),在很大程度上緩解了交通擁堵的問(wèn)題,減輕了駕駛員的駕駛負(fù)擔(dān),提高了駕駛安全。然而,真實(shí)的行車(chē)環(huán)境往往是復(fù)雜多變的,這對(duì)自動(dòng)駕駛汽車(chē)的安全性提出了很高的要求。例如,當(dāng)周?chē)衅渌?chē)輛駛?cè)?,自?dòng)駕駛汽車(chē)應(yīng)當(dāng)及時(shí)減速以避免碰撞。自動(dòng)駕駛車(chē)輛需要具備預(yù)測(cè)未來(lái)交通狀況的能力,從而像人類(lèi)駕駛員一樣在行駛的過(guò)程中做出合理的決策規(guī)劃。由于道路使用者之間存在著強(qiáng)烈的相互作用,并且這種相互作用是未知的,這使得準(zhǔn)確建模和預(yù)測(cè)目標(biāo)車(chē)輛的未來(lái)軌跡面臨許多挑戰(zhàn)。在過(guò)去的幾年中,越來(lái)越多的研究人員開(kāi)始使用LSTM等神經(jīng)網(wǎng)絡(luò)處理軌跡預(yù)測(cè)問(wèn)題,預(yù)測(cè)精度得到了明顯提升,但仍然存在著一些局限。首先,LSTM作為目前處理軌跡預(yù)測(cè)任務(wù)的主要方法,其工作原理是按順序處理時(shí)間序列數(shù)據(jù),以表征車(chē)輛的速度、方向和運(yùn)動(dòng)模式。在工作過(guò)程中LSTM需要不斷地將自身上一刻的輸出當(dāng)作輸入的反饋循環(huán),這會(huì)為模型帶來(lái)很高的計(jì)算成本,特別是對(duì)于處理時(shí)間跨度較大的預(yù)測(cè)問(wèn)題仍然具有明顯的局限性。其次,目前在軌跡預(yù)測(cè)問(wèn)題上對(duì)注意力機(jī)制的應(yīng)用過(guò)于簡(jiǎn)單,還無(wú)法細(xì)致地模擬出車(chē)輛之間的互動(dòng)。最后,現(xiàn)有研究大多是將軌跡預(yù)測(cè)和車(chē)輛換道意圖分別進(jìn)行研究,建立兩個(gè)預(yù)測(cè)模型,這樣難免會(huì)忽略車(chē)輛換道意圖于未來(lái)軌跡之間的內(nèi)在聯(lián)系,進(jìn)而犧牲了準(zhǔn)確性。

主要內(nèi)容:

本文模型主要由編碼器、意圖-軌跡融合模塊、解碼器三部分組成,如圖2所示。編碼器中包含空間交互感知模塊(SIPM)和時(shí)間依賴(lài)感知模塊(TDPM),可以提取軌跡數(shù)據(jù)中的時(shí)空特征,進(jìn)而獲得意圖特征向量和軌跡特征向量。意圖-軌跡融合模塊將車(chē)輛的意圖概率與軌跡特征向量相融合獲得具有更加豐富信息的融合嵌入。最后,解碼器根據(jù)意圖-軌跡的融合嵌入生成更加準(zhǔn)確的軌跡。

SIPM由多尺度超圖模塊(MHM)和圖注意力模塊(GAM)構(gòu)成。其中,MHM通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)超圖拓?fù)浣Y(jié)構(gòu),從多個(gè)智能體軌跡中捕獲成對(duì)和分組的交互,從而學(xué)習(xí)到更能表示空間交互信息的嵌入表示,結(jié)構(gòu)如圖3所示。GAM通過(guò)在節(jié)點(diǎn)之間引入注意力機(jī)制使得模型能夠更好地捕捉節(jié)點(diǎn)之間的關(guān)系和和特征信息。MHM對(duì)于處理群體性的交互更具有優(yōu)勢(shì),GAM則更擅長(zhǎng)捕捉局部關(guān)鍵節(jié)點(diǎn)關(guān)系,將二者提取到的空間特征進(jìn)行融合,可以獲得更加全面的特征表示。TDPM主要是由可變形注意力機(jī)制、前饋神經(jīng)網(wǎng)絡(luò)、殘差連接和歸一化層組成的。意圖-軌跡融合模塊可以在軌跡特征饋入解碼器生成未來(lái)軌跡之前,首先預(yù)測(cè)車(chē)輛的換道意圖,并將意圖概率與歷史軌跡嵌入、軌跡特征向量進(jìn)行融合,將此包含更豐富信息的嵌入饋入到解碼器中,確保模型能夠更加全面地理解場(chǎng)景動(dòng)態(tài),進(jìn)而輸出更為精確的車(chē)輛未來(lái)軌跡預(yù)測(cè)結(jié)果。解碼器結(jié)構(gòu)與TDPM結(jié)構(gòu)類(lèi)似,主要由可變形注意力層、前饋神經(jīng)網(wǎng)絡(luò)、殘差連接和歸一化層組成。

image.png

圖2. MGNformer模型架構(gòu)圖

image.png

圖3 MHM結(jié)構(gòu)圖

結(jié)論:

本文提出了一種基于多種圖神經(jīng)網(wǎng)絡(luò)和Transformer的車(chē)輛軌跡預(yù)測(cè)方法使用多尺度超圖神經(jīng)網(wǎng)絡(luò)和圖注意力網(wǎng)絡(luò)提取不同維度上軌跡數(shù)據(jù)的空間特征,使用可變形注意力機(jī)制捕捉軌跡數(shù)據(jù)中時(shí)間維度上的長(zhǎng)距離依賴(lài)關(guān)系,進(jìn)而得到高質(zhì)量的軌跡時(shí)空特征。為了描述車(chē)輛意圖與未來(lái)軌跡之間的相關(guān)性,本文額外設(shè)計(jì)意圖分類(lèi)任務(wù),將車(chē)輛的意圖概率與軌跡特征融合,從而生成更加準(zhǔn)確的未來(lái)軌跡。實(shí)驗(yàn)結(jié)果表明,MGNformer在單模態(tài)預(yù)測(cè)和多模態(tài)預(yù)測(cè)上都明顯優(yōu)于其他最先進(jìn)的方法目前,本工作僅在高速公路場(chǎng)景中驗(yàn)證了預(yù)測(cè)模型的效果,在未來(lái)的研究中我們將把模型的應(yīng)用擴(kuò)展到更廣泛的應(yīng)用場(chǎng)景中,以彰顯實(shí)用價(jià)值。

作者簡(jiǎn)介:

劉建偉,教師,學(xué)者。發(fā)表學(xué)術(shù)研究論文280多篇。