侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

Waymo首席科學(xué)家在MIT自動(dòng)駕駛課上開(kāi)講:如何解決自動(dòng)駕駛的長(zhǎng)期挑戰(zhàn)

那么我們?nèi)绾芜M(jìn)行大規(guī)模的路測(cè)呢?

因?yàn)樘厥夂币?jiàn)的異常情況很少發(fā)生,如果使用真實(shí)情況進(jìn)行路測(cè),我們需要等待很長(zhǎng)時(shí)間,為了解決這個(gè)問(wèn)題,我們自己構(gòu)建條道路。

因?yàn)槲覀冇蠫oogle的數(shù)據(jù)支持所以這個(gè)想法是可行的,所以我們按照如下圖數(shù)據(jù)做出仿真模型。仿真出足夠多的場(chǎng)景供以測(cè)試。而我們?yōu)槭裁匆龀鋈绱硕嗟姆抡婺P湍兀?/strong>因?yàn)橛袝r(shí)會(huì)得出截然相反的結(jié)果,所以我們要加強(qiáng)系統(tǒng)的魯棒性,這就要求我們做出足夠多的仿真模型,確保系統(tǒng)的準(zhǔn)確性。

這是一種抽樣方法。

上圖正在模擬真實(shí)世界可能會(huì)發(fā)生的事情。如果想要得到準(zhǔn)確的數(shù)據(jù),我們需要模仿真實(shí)的人類(lèi)在不同的情形下做出的真實(shí)舉動(dòng)。

如何評(píng)價(jià)這個(gè)簡(jiǎn)單的模型呢?

正面:容易調(diào)整關(guān)鍵參數(shù),如反應(yīng)時(shí)間,制動(dòng)輪廓,橫向加速。有效再現(xiàn)避碰場(chǎng)景中的基本人類(lèi)行為;反面:無(wú)法處理更復(fù)雜的交互行為。

但是定義它本身是一個(gè)復(fù)雜的問(wèn)題,所以我們能做什么呢?那就是從實(shí)際演示中學(xué)習(xí)代理模型。

機(jī)器學(xué)習(xí)仿真的解決辦法就是構(gòu)建另一個(gè)機(jī)器學(xué)習(xí)模型。

添加排列可能會(huì)出現(xiàn)問(wèn)題,這是一個(gè)眾所周知的問(wèn)題。

我們使用了非常不同的體系結(jié)構(gòu)去避免碰撞,例如RNN模型。

在一條陌生的路上開(kāi)著車(chē),需要看到更多的范圍和預(yù)判更多的特殊情況,如掉頭需要處理好。

上圖是人類(lèi)行為分布,可以看到這是個(gè)正態(tài)分布,所以這就是導(dǎo)致了“長(zhǎng)尾巴情況”的根本原因。即使圖像兩端的情況很少發(fā)生,我們的測(cè)試也要涵蓋進(jìn)去所有的人類(lèi)行為情況。

需要我們拓寬這個(gè)分布,或者仿真出更多的例子。

行為軌跡優(yōu)化模型:反RL用于找到創(chuàng)建所需軌跡的變量。

許多不同的方法來(lái)克服“長(zhǎng)尾”問(wèn)題。

“智能”模型對(duì)于自動(dòng)化是至關(guān)重要的。通過(guò)模擬更真實(shí)人類(lèi)行為是非常重要的。

因?yàn)檫存在很多不同的場(chǎng)景,每天都上演著不同的事情,所以“長(zhǎng)尾巴情況”還將會(huì)在不同的城市,不同的環(huán)境中持續(xù)下去的。

在一些好的訓(xùn)練步驟如下:對(duì)收集的數(shù)據(jù)進(jìn)行培訓(xùn);能夠在不確定或不正確的情況下進(jìn)行量化;能夠采取措施,比如向評(píng)分者提問(wèn);更好的是,通過(guò)因果分析直接自我更新。

總結(jié):Waymo 專(zhuān)家舉出的有人帶著停車(chē)標(biāo)志是一個(gè)有趣例子,而且對(duì)機(jī)器學(xué)習(xí)的一個(gè)非常基本的介紹,其中提到了AutoML模型,可以測(cè)試多達(dá)10K的不同架構(gòu)。然后采用前100個(gè)架構(gòu),在更大的模型上進(jìn)行測(cè)試。Waymo是一個(gè)混合系統(tǒng),使用ML和混合ML(傳統(tǒng)的ML編程)。隨著ML能力的增長(zhǎng),傳統(tǒng)場(chǎng)景越來(lái)越少。視頻中也提到了waymo 如何測(cè)試,結(jié)構(gòu)化測(cè)試,是否有封閉的測(cè)試環(huán)境。在模擬器方面,他們認(rèn)為代理能夠模擬現(xiàn)實(shí)世界中發(fā)生的事情。不斷擴(kuò)大復(fù)雜模型,來(lái)處理長(zhǎng)尾問(wèn)題;蛘呃脤(zhuān)家領(lǐng)域知識(shí),換句話說(shuō)混合模型或傳統(tǒng)編程。以及逆強(qiáng)化學(xué)習(xí),值得深入研究。


<上一頁(yè)  1  2  3  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)