侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

鄭南寧:直覺(jué)AI與無(wú)人駕駛

小鄭院士從人工智能的五大學(xué)術(shù)流派講起,分析了符號(hào)化人工智能與深度神經(jīng)網(wǎng)絡(luò)的局限性,并詳細(xì)剖析了“使機(jī)器像人一樣對(duì)物理世界直觀理解”的直覺(jué)AI,以其團(tuán)隊(duì)實(shí)踐的無(wú)人駕駛為例,分析人工智能中的認(rèn)知與推理是如何解決實(shí)際問(wèn)題的。

“首屆中國(guó)認(rèn)知計(jì)算與混合智能學(xué)術(shù)大會(huì)”于2018年8月25-26日在西安舉行。本次大會(huì)的主題是研討與交流認(rèn)知科學(xué)、神經(jīng)科學(xué)與人工智能學(xué)科等領(lǐng)域交叉融合的最新進(jìn)展和前沿技術(shù),西安交通大學(xué)人工智能與機(jī)器人研究所教授,中國(guó)工程院院士鄭南寧作為大會(huì)報(bào)告的最后一位嘉賓分享了題為《直覺(jué)性AI與無(wú)人駕駛》報(bào)告。鄭院士從人工智能的五大學(xué)術(shù)流派講起,分析了符號(hào)化人工智能與深度神經(jīng)網(wǎng)絡(luò)的局限性,并詳細(xì)剖析了“使機(jī)器像人一樣對(duì)物理世界直觀理解”的直覺(jué)AI,以其團(tuán)隊(duì)實(shí)踐的無(wú)人駕駛為例,分析人工智能中的認(rèn)知與推理是如何解決實(shí)際問(wèn)題的。以下為報(bào)告的主要內(nèi)容:

傳統(tǒng)人工智能及其局限性

人工智能追求的長(zhǎng)期目標(biāo)是使機(jī)器能像人類一樣感知世界和解決問(wèn)題。對(duì)當(dāng)前人工智能而言,解決某些對(duì)人類來(lái)說(shuō)屬于智力挑戰(zhàn)的問(wèn)題可能是相對(duì)簡(jiǎn)單的,但對(duì)看似簡(jiǎn)單的與真實(shí)物理世界交互的能力依然非常差(無(wú)人駕駛就屬于這類問(wèn)題)。

目前,人工智能主要有以下五大學(xué)術(shù)流派:

①符號(hào)主義:使用符號(hào)、規(guī)則和邏輯來(lái)表征知識(shí)和進(jìn)行邏輯推理,最喜歡的算法是:規(guī)則和決策樹(shù)

②聯(lián)結(jié)主義:使用概率矩陣和加權(quán)神經(jīng)元來(lái)動(dòng)態(tài)地識(shí)別和歸納模式,最喜歡的算法是:神經(jīng)網(wǎng)絡(luò)
③貝葉斯派:獲取發(fā)生的可能性來(lái)進(jìn)行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫

④進(jìn)化主義:生成變化,然后為特定目標(biāo)獲取其中最優(yōu)的,最喜歡的算法是:遺傳算法
⑤Analogizer:根據(jù)約束條件來(lái)優(yōu)化函數(shù)(盡可能走到更高,但同時(shí)不要離開(kāi)道路),常用的算法:支持向量機(jī)(SVM)。

人類面臨的許多問(wèn)題具有不確定性、脆弱性和開(kāi)放性。今天人工智能的理論框架,建立在演繹邏輯和語(yǔ)義描述的基礎(chǔ)方法之上,但我們不可能對(duì)人類社會(huì)的所有問(wèn)題建模,因?yàn)檫@中間存在著條件問(wèn)題,我們不可能把一個(gè)行為的所有條件都模擬出,這是傳統(tǒng)人工智能的局限性。

符號(hào)化人工智能的局限性

需要對(duì)問(wèn)題本身抽象出一個(gè)精確數(shù)學(xué)意義上的解析式的數(shù)學(xué)模型(抽象不出,即歸納為不可解問(wèn)題)

需要對(duì)已建立的數(shù)學(xué)模型設(shè)計(jì)出確定的算法

確定的算法無(wú)法表示現(xiàn)實(shí)世界問(wèn)題所固有的測(cè)不準(zhǔn)性和不完備性

圖靈意義下的可計(jì)算問(wèn)題都是可遞歸的(“可遞歸的”都是有序的,而實(shí)際中存在大量的開(kāi)放性、動(dòng)態(tài)性和脆弱性問(wèn)題)

深度神經(jīng)網(wǎng)絡(luò)的局限性

過(guò)度依靠訓(xùn)練數(shù)據(jù)

缺乏推理和對(duì)因果關(guān)系的表達(dá)能力(而大量的人工智能問(wèn)題需要給出處理對(duì)象間的關(guān)聯(lián)、因果以及控制關(guān)系)

依靠于指令驅(qū)動(dòng)或數(shù)據(jù)驅(qū)動(dòng),其存儲(chǔ)架構(gòu)無(wú)法進(jìn)行高效的圖數(shù)據(jù)索引和存儲(chǔ)(而在一些應(yīng)用中需要基于事件驅(qū)動(dòng)的計(jì)算)

無(wú)法在計(jì)算過(guò)程中實(shí)現(xiàn)有效的注意機(jī)制(計(jì)算負(fù)載與資源分配),而選擇性注意機(jī)制是構(gòu)成高級(jí)AI的基本核心

鄭南寧:直覺(jué)AI與無(wú)人駕駛

直覺(jué)AI

人腦對(duì)于非認(rèn)知因素的理解更多地來(lái)自于直覺(jué),并受到經(jīng)驗(yàn)和長(zhǎng)期知識(shí)積累的影響,這些因素在人對(duì)物理環(huán)境理解與行為交互、非完整信息處理等問(wèn)題中有著極其重要的作用。而且人類的學(xué)習(xí)是一種與事物互動(dòng)的過(guò)程,人類認(rèn)知過(guò)程中的特征概念形成往往是建立在語(yǔ)義解釋的基礎(chǔ)上;人類依賴對(duì)事物的觀察(或顯著性特征的注意)在大腦中建立不同的內(nèi)部分析模型,并利用這些模型來(lái)推測(cè)事物的變化,或是從過(guò)去的事件預(yù)測(cè)未來(lái)。

而機(jī)器學(xué)習(xí)中的特征提取及預(yù)測(cè)模型與人類認(rèn)知過(guò)程中的特征概念形成及其內(nèi)部分析模型是完全不同的,為使機(jī)器學(xué)習(xí)模型產(chǎn)生人類的認(rèn)知結(jié)果,需要其所學(xué)特征在一定程度上符合神經(jīng)生理學(xué)實(shí)驗(yàn)結(jié)果,同時(shí)要使特征具有數(shù)學(xué)和語(yǔ)義的解釋性。此外,大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的可塑性,以及人腦在非認(rèn)知因素和認(rèn)知功能之間的相互作用,它們是形式化方法難以、甚至不能描述的。因此,我們需要從腦認(rèn)知機(jī)理和神經(jīng)科學(xué)獲得靈感和啟發(fā),發(fā)展新的AI計(jì)算模型與架構(gòu),讓機(jī)器具備對(duì)物理世界最基本的感知與反應(yīng),即使機(jī)器具有“常識(shí)”推理的能力,從而實(shí)現(xiàn)更加健壯的人工智能系統(tǒng)。

我們要建造一種更加健壯的人工智能,需要腦認(rèn)知和神經(jīng)科學(xué)的啟發(fā)。計(jì)算機(jī)和人類大腦是對(duì)問(wèn)題求解的物質(zhì)基礎(chǔ)。在智力和計(jì)算能力方面,計(jì)算機(jī)遠(yuǎn)遠(yuǎn)超過(guò)了人類,但是人類面對(duì)的大部分問(wèn)題都是開(kāi)放的、動(dòng)態(tài)的、復(fù)雜的,大腦在處理這種問(wèn)題時(shí)表現(xiàn)出的想象和創(chuàng)造,還有對(duì)復(fù)雜問(wèn)題的分析和描述,是傳統(tǒng)人工智能的方法所不能企及的,我們只能夠從人類大腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中去獲得構(gòu)造新的人工智能的因素。

直覺(jué)推理

直覺(jué)和敏感都屬于創(chuàng)造性思維,警察在破案中,靠的是多年積累和實(shí)踐,形成的直覺(jué)判斷。靈感、頓悟與直覺(jué)的區(qū)別是,直覺(jué)是對(duì)當(dāng)前環(huán)境的反應(yīng),它在現(xiàn)在人工智能的發(fā)展中扮演著十分重要的角色。我們需要一種基于直覺(jué)的人工智能,也可以將它看成一種基于直覺(jué)的推理。

人的直覺(jué)反應(yīng)實(shí)際上是尋找全局最優(yōu)解。要構(gòu)造直覺(jué)推理,需要連個(gè)關(guān)鍵因素:1.需要構(gòu)造一個(gè)成本函數(shù);2.需要給出一個(gè)決策結(jié)構(gòu),而這個(gè)決策結(jié)構(gòu)就建立在記憶基礎(chǔ)上。

人在觀察事物時(shí),一定會(huì)形成一種與時(shí)間相關(guān)的影像。如果把直覺(jué)推理和數(shù)學(xué)歸納演繹推理兩類機(jī)制組合,就可以實(shí)現(xiàn)基于認(rèn)知計(jì)算或受神經(jīng)科學(xué)啟發(fā)的人工智能。

認(rèn)知推理

我們把認(rèn)知推理稱為直觀、樸素的物理推理。物理層面的認(rèn)知推理可以化解時(shí)間與空間,追蹤事物的發(fā)展軌跡。認(rèn)知推理的另一個(gè)要素在心理層面,簡(jiǎn)而言之就是學(xué)習(xí)方向受心理狀態(tài)的引導(dǎo)。我們需要把物理層面和心理層面的推理嵌入到推理的人工智能系統(tǒng)中。

使機(jī)器像人一樣對(duì)物理世界直觀理解

實(shí)現(xiàn)物理層面認(rèn)知推理的基本要素:

(1)物理(或?qū)ο螅┨卣鞯淖R(shí)別,并形成長(zhǎng)短期記憶

(2)物理(或?qū)ο螅┲g相互關(guān)系與作用的直觀理解

(3)基于想象力的行為模型產(chǎn)生

關(guān)于物體(或?qū)ο螅┑年P(guān)系和物理層面的直觀推理是人類智力的核心,使機(jī)器像人一樣對(duì)物理世界直觀理解是人工智能追求的科學(xué)目標(biāo)之一。

構(gòu)造一個(gè)具體的人工智能系統(tǒng)

直覺(jué)推理、認(rèn)知推理和因果模型是構(gòu)建健壯的人工智能必須考慮的基本因素。那么如何來(lái)構(gòu)造一個(gè)具體的系統(tǒng)?構(gòu)造機(jī)器人需要三個(gè)基本要素:1.對(duì)環(huán)境中的所有對(duì)象進(jìn)行特征識(shí)別,并且進(jìn)行長(zhǎng)期記憶;2.理出對(duì)象間的關(guān)系,并對(duì)它們相互間的作用進(jìn)行描述;3.基于想象力的行為模型,人在進(jìn)行具體行動(dòng)之前,會(huì)想象其帶來(lái)的后果,但機(jī)器就需要分析物體之間的各種關(guān)系。

這三種要素是讓機(jī)器像人一樣理解物理世界的基礎(chǔ)。具有想象力的人工智能,就需要:

構(gòu)造一個(gè)內(nèi)部預(yù)測(cè)的模型,在行動(dòng)之前預(yù)想到的結(jié)果;

給出環(huán)境模型,提取有用信息;

規(guī)劃想象行為,最大化任務(wù)效率(具有想象力的AI)

用認(rèn)知解決無(wú)人駕駛

我們?cè)?2000 年初就開(kāi)始做無(wú)人駕駛,有人說(shuō)要把無(wú)人駕駛汽車和城市真實(shí)場(chǎng)景的車融合,我們還面臨非常艱難的挑戰(zhàn),有相當(dāng)長(zhǎng)的路要走。車聯(lián)網(wǎng),V2X,V2V,都一樣。在這種局部、動(dòng)態(tài)的場(chǎng)景中,我們?cè)鯓幼?span id="rfv79jb" class='hrefStyle'>自動(dòng)駕駛跟環(huán)境融合,確實(shí)是一個(gè)很大的問(wèn)題。

無(wú)人駕駛技術(shù)的五大難題:

1.場(chǎng)景的“可靠感知”

無(wú)論何種路況或天氣必須可靠地感知周圍的場(chǎng)景

2.“預(yù)行為”理解

判斷或理解交通場(chǎng)景中不同運(yùn)動(dòng)對(duì)象細(xì)微的預(yù)行為

3.“意外遭遇”的應(yīng)對(duì)

解釋異常情況,如交警的手勢(shì)、意外的交通情境

4.“人—車的自然交互”

理解并回答乘客提出的請(qǐng)求,不是簡(jiǎn)單的“點(diǎn)到點(diǎn)的行駛”

5.網(wǎng)絡(luò)安全

通過(guò)云端獲取和更新地圖使自主駕駛面臨更大的風(fēng)險(xiǎn)

現(xiàn)在絕大多數(shù)自動(dòng)駕駛采取了場(chǎng)景感知與定位,決策規(guī)劃與控制,這是一種簡(jiǎn)單的 ADAS 形式,但我們要如何通過(guò)新的方法來(lái)解決這個(gè)問(wèn)題?

場(chǎng)景感知與情境計(jì)算

鄭南寧:直覺(jué)AI與無(wú)人駕駛

場(chǎng)景是某個(gè)交互場(chǎng)合在特定時(shí)間和空間中的具體情境和影象,它可以定義為一種實(shí)體。情境是指這種實(shí)體隨著時(shí)間和空間變化而產(chǎn)生的關(guān)聯(lián)。情境計(jì)算是對(duì)場(chǎng)景各個(gè)關(guān)聯(lián)的對(duì)象做解釋,可以定義為一個(gè)行為相關(guān)體。

這里的問(wèn)題就是,第一,要讓自動(dòng)駕駛汽車像人一樣理解和記憶,就要具有記憶推理和經(jīng)驗(yàn)分析的技術(shù);第二就,進(jìn)化發(fā)展的自動(dòng)駕駛,其學(xué)習(xí)過(guò)程要像人類一樣熟能生巧。

人類視覺(jué)關(guān)注的基本機(jī)制是選擇、組織、整合、編碼。

人對(duì)變化是非常敏感的,可以提取交通場(chǎng)景中的顯著性變化。比如你在開(kāi)車時(shí),如果右前方突然來(lái)了一個(gè)騎自行車的人,你的注意力會(huì)轉(zhuǎn)移到騎車人的身上。在自動(dòng)駕駛汽車上,我們要構(gòu)造一個(gè)選擇性的注意機(jī)制網(wǎng)絡(luò),對(duì)數(shù)種圖像進(jìn)行理解,并根據(jù)內(nèi)部狀態(tài)的表示,忽略不相關(guān)的對(duì)象,選擇下一步要采取的動(dòng)作。

把場(chǎng)景感知和情景認(rèn)知結(jié)合起來(lái),需要我們構(gòu)建一個(gè)模型,融合先進(jìn)知識(shí)概念,實(shí)現(xiàn)記憶學(xué)習(xí)。

場(chǎng)景感知是將通過(guò)各種不同屬性的傳感器獲得的不同數(shù)據(jù),提供到深度學(xué)習(xí)中,之后再根據(jù)長(zhǎng)短期記憶和定位網(wǎng)絡(luò),進(jìn)行情境計(jì)算。在這種框架中,我們可以把場(chǎng)景感知和情境計(jì)算融合在一起。

一個(gè)高效的情景計(jì)算要運(yùn)用實(shí)際情境的因果關(guān)聯(lián),在最前端的數(shù)據(jù)層面進(jìn)行有效計(jì)算,這就需要把數(shù)據(jù)驅(qū)動(dòng)變成事件驅(qū)動(dòng)。人在開(kāi)車時(shí),根據(jù)情境判斷前方可不可以行駛,這就是把數(shù)據(jù)驅(qū)動(dòng)變成事件驅(qū)動(dòng)。

怎么構(gòu)造事件驅(qū)動(dòng)?就是把可見(jiàn)光和激光點(diǎn)云數(shù)據(jù)融合在一起,把三維數(shù)據(jù)轉(zhuǎn)化成二維圖像數(shù)據(jù)。點(diǎn)云數(shù)據(jù)給出了每一個(gè)生物體的明確的點(diǎn),二維圖像沒(méi)有深度信息,它是圖像的幾何形狀變化。把人的數(shù)據(jù)和激光點(diǎn)云的數(shù)據(jù)融合,用數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)變?yōu)槭录?qū)動(dòng),就得出了可行駛數(shù)據(jù)和不可行駛數(shù)據(jù)大的劃分。

人開(kāi)車的時(shí)候,他在注意什么,我們就來(lái)構(gòu)建一個(gè)類似的選擇性基礎(chǔ),把同樣的場(chǎng)景輸入到一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)中,通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)提取特征和人的注意力。

實(shí)現(xiàn)復(fù)雜路況中無(wú)人駕駛的四個(gè)核心技術(shù)

1.如何在環(huán)境感知數(shù)據(jù)獲取與融合過(guò)程給出知覺(jué)物體的基本判斷,形成選擇注意的基本單元;

2.如何在注意的基礎(chǔ)上,將非完整的環(huán)境信息轉(zhuǎn)化為用于決策規(guī)劃的空間結(jié)構(gòu)信息;知覺(jué)編組能用最少的領(lǐng)域只是形成目標(biāo)假設(shè);

3.如何在學(xué)習(xí)和知識(shí)集成的基礎(chǔ)上,實(shí)時(shí)處理行駛過(guò)程中的突發(fā)事件,即具有自學(xué)習(xí)功能

4.如何在環(huán)境交互和行為決策的基礎(chǔ)上,構(gòu)建無(wú)人駕駛的控制系統(tǒng)

鄭南寧:直覺(jué)AI與無(wú)人駕駛

總結(jié)

大腦還有許多未解之謎,腦認(rèn)知和神經(jīng)科學(xué)研究的每一項(xiàng)真正的突破都伴隨著艱難的歷程。我們需要更多時(shí)間來(lái)發(fā)現(xiàn)受腦認(rèn)知和神經(jīng)科學(xué)啟發(fā)的人工智能突破點(diǎn)在哪里?把研究建立在嚴(yán)謹(jǐn)?shù)睦碚、模型建造、?shí)驗(yàn)驗(yàn)證與分析的基礎(chǔ)上。

新一代人工智能的發(fā)展離不開(kāi)信息科學(xué)、認(rèn)知科學(xué)、神經(jīng)科學(xué)、數(shù)學(xué)等學(xué)科的共同進(jìn)步,必須加強(qiáng)來(lái)自多學(xué)科的實(shí)驗(yàn)科學(xué)家和理論科學(xué)家的合作。

現(xiàn)代科學(xué)的進(jìn)步往往是在新的思想和已有的成見(jiàn)之間精致平衡中實(shí)現(xiàn)的。面對(duì)人工智能研究與應(yīng)用的熱潮,需要保持冷靜思考和踏實(shí)工作;期望值過(guò)高,又沒(méi)有達(dá)到預(yù)期的目標(biāo),有可能會(huì)給學(xué)科發(fā)展帶來(lái)的低潮甚至災(zāi)難性的后果,使最初的期望目標(biāo)成為“皇帝的新衣。


聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)