麻省理工學(xué)院:預(yù)測(cè)他人在路上的行為
人類可能是讓全自動(dòng)駕駛汽車遠(yuǎn)離城市街道的障礙之一。
如果機(jī)器人要在波士頓市中心安全地駕駛車輛,它必須能夠預(yù)測(cè)附近的司機(jī)、騎自行車的人和行人接下來(lái)會(huì)做什么。
然而,行為預(yù)測(cè)是一個(gè)棘手的問(wèn)題,目前的人工智能解決方案要么過(guò)于簡(jiǎn)單(他們可能假設(shè)行人總是走直線),要么過(guò)于保守(為了避開行人,機(jī)器人只是將車停在公園里),要么只預(yù)測(cè)一個(gè)代理的下一步動(dòng)作(道路通常同時(shí)承載許多用戶。)
麻省理工學(xué)院的研究人員為這一復(fù)雜挑戰(zhàn)設(shè)計(jì)了一種看似簡(jiǎn)單的解決方案。他們將多智能體行為預(yù)測(cè)問(wèn)題分解成更小的部分并單獨(dú)處理每個(gè)部分,因此計(jì)算機(jī)可以實(shí)時(shí)解決這一復(fù)雜任務(wù)。
他們的行為預(yù)測(cè)框架首先猜測(cè)兩個(gè)道路使用者之間的關(guān)系——哪輛車、騎自行車的人或行人擁有通行權(quán),以及哪個(gè)代理會(huì)讓路——并使用這些關(guān)系來(lái)預(yù)測(cè)多個(gè)代理的未來(lái)軌跡。
與自動(dòng)駕駛公司 Waymo 編制的龐大數(shù)據(jù)集中的真實(shí)交通流量相比,這些估計(jì)的軌跡比其他機(jī)器學(xué)習(xí)模型的軌跡更準(zhǔn)確。麻省理工學(xué)院的技術(shù)甚至優(yōu)于 Waymo 近發(fā)布的模型。由于研究人員將問(wèn)題分解為更簡(jiǎn)單的部分,他們的技術(shù)使用的內(nèi)存更少。
“這是一個(gè)非常直觀的想法,但之前沒(méi)有人充分探索過(guò),而且效果很好。簡(jiǎn)單是一個(gè)優(yōu)點(diǎn)。我們正在將我們的模型與該領(lǐng)域的其他模型進(jìn)行比較,包括來(lái)自該領(lǐng)域公司 Waymo 的模型,我們的模型在這個(gè)具有挑戰(zhàn)性的基準(zhǔn)測(cè)試中實(shí)現(xiàn)了性能。這對(duì)未來(lái)有很大的潛力。計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)成員。
與黃和威廉姆斯一起參與論文的還有來(lái)自中國(guó)清華大學(xué)的三位研究人員:共同主要作者、研究助理孫喬;顧君如,研究生;和作者趙航博士'19,助理教授。該研究將在計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議上發(fā)表。
多個(gè)小模型
研究人員的機(jī)器學(xué)習(xí)方法稱為 M2I,它需要兩個(gè)輸入:汽車、騎自行車的人和行人在交通環(huán)境(例如四向交叉路口)中交互的過(guò)去軌跡,以及帶有街道位置、車道配置等的地圖。
使用此信息,關(guān)系預(yù)測(cè)器推斷出兩個(gè)代理中的哪一個(gè)首先擁有通行權(quán),將一個(gè)分類為通過(guò)者,一個(gè)分類為屈服者。然后一個(gè)預(yù)測(cè)模型(稱為邊際預(yù)測(cè)器)猜測(cè)通過(guò)代理的軌跡,因?yàn)樵摯愍?dú)立運(yùn)行。
第二個(gè)預(yù)測(cè)模型,稱為條件預(yù)測(cè)器,然后根據(jù)通過(guò)代理的動(dòng)作猜測(cè)讓步代理將做什么。系統(tǒng)預(yù)測(cè)出讓者和通過(guò)者的許多不同軌跡,分別計(jì)算每一個(gè)的概率,然后選擇發(fā)生可能性的六個(gè)聯(lián)合結(jié)果。
M2I 輸出預(yù)測(cè)這些代理將如何在接下來(lái)的 8 秒內(nèi)通過(guò)流量。在一個(gè)示例中,他們的方法使車輛減速,以便行人可以過(guò)馬路,然后在他們通過(guò)交叉路口時(shí)加速。在另一個(gè)示例中,車輛等到幾輛汽車通過(guò)后才從一條小街轉(zhuǎn)向繁忙的主干道。
雖然這項(xiàng)初步研究側(cè)重于兩個(gè)代理之間的交互,但 M2I 可以推斷許多代理之間的關(guān)系,然后通過(guò)鏈接多個(gè)邊際和條件預(yù)測(cè)變量來(lái)猜測(cè)它們的軌跡。
真實(shí)世界的駕駛測(cè)試
研究人員使用 Waymo Open Motion 數(shù)據(jù)集訓(xùn)練模型,該數(shù)據(jù)集包含由安裝在公司自動(dòng)駕駛汽車上的激光雷達(dá)(光檢測(cè)和測(cè)距)傳感器和攝像頭記錄的數(shù)百萬(wàn)個(gè)涉及車輛、行人和騎自行車者的真實(shí)交通場(chǎng)景。他們特別關(guān)注具有多個(gè)代理的案例。
為了確定準(zhǔn)確性,他們將每種方法的六個(gè)預(yù)測(cè)樣本(按置信度加權(quán))與場(chǎng)景中汽車、騎自行車者和行人所遵循的實(shí)際軌跡進(jìn)行了比較。他們的方法是準(zhǔn)確的。它還在被稱為重疊率的指標(biāo)上優(yōu)于基線模型;如果兩條軌跡重疊,則表明發(fā)生了碰撞。M2I 的重疊率。
“我們不只是建立一個(gè)更復(fù)雜的模型來(lái)解決這個(gè)問(wèn)題,而是采用了一種更像人類在推理與他人互動(dòng)時(shí)的思維方式的方法。人類不會(huì)對(duì)未來(lái)行為的所有數(shù)百種組合進(jìn)行推理。我們做出決定的速度非常快,”黃說(shuō)。
M2I 的另一個(gè)優(yōu)點(diǎn)是,因?yàn)樗鼘?wèn)題分解成更小的部分,用戶更容易理解模型的決策。黃說(shuō),從長(zhǎng)遠(yuǎn)來(lái)看,這可以幫助用戶更加信任自動(dòng)駕駛汽車。
但是該框架無(wú)法解釋兩個(gè)代理相互影響的情況,例如兩輛車在四向停車時(shí)各自向前輕推,因?yàn)樗緳C(jī)不確定誰(shuí)應(yīng)該讓步。
他們計(jì)劃在未來(lái)的工作中解決這一限制。他們還希望使用他們的方法來(lái)模擬道路使用者之間的真實(shí)交互,這可用于驗(yàn)證自動(dòng)駕駛汽車的規(guī)劃算法或創(chuàng)建大量合成駕駛數(shù)據(jù)以提高模型性能。
“預(yù)測(cè)多個(gè)交互代理的未來(lái)軌跡尚未得到充分探索,并且對(duì)于在復(fù)雜場(chǎng)景中實(shí)現(xiàn)完全自治極具挑戰(zhàn)性。M2I 提供了一種非常有前途的預(yù)測(cè)方法,其關(guān)系預(yù)測(cè)器可以區(qū)分邊緣預(yù)測(cè)或有條件預(yù)測(cè)的代理,這顯著簡(jiǎn)化了問(wèn)題,”加州大學(xué)伯克利分校機(jī)械工程杰出教授和 Wei助理專業(yè)研究員詹在一封電子郵件中。“預(yù)測(cè)模型可以捕捉代理之間的內(nèi)在關(guān)系和交互,以實(shí)現(xiàn)的性能?!?nbsp;這兩位同事沒(méi)有參與這項(xiàng)研究。
這項(xiàng)研究得到了高通創(chuàng)新獎(jiǎng)學(xué)金的部分支持。豐田研究所也提供資金支持這項(xiàng)工作。