訂閱
糾錯(cuò)
加入自媒體

具身智能,開啟機(jī)器人紀(jì)元

導(dǎo)語:?形機(jī)器?將是下?代終端。具?智能機(jī)器?的出現(xiàn)才會是真正的「iPhone」時(shí)刻。

時(shí)至8月,火熱了半年之久的AI賽道,已儼然顯示出了降溫之勢。

可就在這個(gè)關(guān)頭,由號稱華為天才少年——稚暉君打造的人形AI機(jī)器人——「遠(yuǎn)征A1」卻赫然登場,用一系列亮眼的特點(diǎn),振奮了已顯冷淡的AI賽場。

舞臺之上,這個(gè)邁著小碎步入場的機(jī)器人,引來了整個(gè)行業(yè)的關(guān)注。

而這個(gè)由智元機(jī)器人(Agibot)發(fā)布的具身智能機(jī)器人,之所以能在業(yè)內(nèi)引起如此大反響,則是因?yàn)槠渚邆淞俗钚碌?strong style="font-weight: bold; border: 0px; font-size: 16px; margin: 0px; padding: 0px;">AI大模型能力。

根據(jù)稚暉君在發(fā)布會上展示的內(nèi)容,靈巧自如的遠(yuǎn)征A1,不但能做家務(wù)、制備實(shí)驗(yàn)樣本,甚至還能勝任看護(hù)老人這類需要“體貼”的工作。

那么,這個(gè)看似“面面俱到”的AI機(jī)器人,究竟是如何在不同環(huán)境中,勝任各種復(fù)雜工作的?

其所代表的AI+具身機(jī)器人賽道,是否真的代表了未來AI的方向?抑或只是像元宇宙那樣,成為一個(gè)難以落地的“概念化”產(chǎn)品?

01 “人形”的必要性

在討論人形機(jī)器人的未來之前,有一個(gè)需要明確的問題是:為什么人類總是傾向于將機(jī)器人設(shè)計(jì)成人形?

對于這個(gè)問題,稚暉君表示,原因就在于“從第一性原理出發(fā),人形雙足機(jī)器人是人類環(huán)境中最為通用的終極形態(tài)!”

換句話說,機(jī)器人要想真正進(jìn)入人類的生活,就得適應(yīng)各種為人體形態(tài)量身打造的場景、設(shè)備、任務(wù)。

例如,具身機(jī)器人如果想幫人類操作儀器,抓握東西,那就必須具備人類那樣靈巧的手指;

如果它想在城市環(huán)境中,邁過各種樓梯、臺階,那就得具備和人類一樣能彎曲的膝蓋。

而要想實(shí)現(xiàn)這樣的靈活性、協(xié)調(diào)性,就必須在機(jī)器人的硬件構(gòu)成上,進(jìn)行一系列重要的設(shè)計(jì)。在這方面,智元機(jī)器人較為獨(dú)特的技術(shù)之一,就是諧波一體關(guān)節(jié)。

這是機(jī)器人的傳動(dòng)裝置,用來降低轉(zhuǎn)速、增大扭矩等,相當(dāng)于人類的「關(guān)節(jié)」。

一般來說,機(jī)器人的結(jié)構(gòu)和關(guān)節(jié),決定了它的自由度,

而自由度是指機(jī)器人的運(yùn)動(dòng)能力,也就是機(jī)器人能夠獨(dú)立控制的運(yùn)動(dòng)變量的個(gè)數(shù)。

自由度越高,機(jī)器人的運(yùn)動(dòng)越靈活,越能適應(yīng)各種復(fù)雜的環(huán)境和任務(wù)。

目前,遠(yuǎn)征A1的自由度超過了49個(gè),手部有12個(gè)主動(dòng)自由度。

而相較之下,馬斯克的“擎天柱”人形雙足機(jī)器人全身有200多個(gè)自由度,手部27個(gè)自由度。

雖與世界頂尖機(jī)器人有著一定差距,但六個(gè)月的時(shí)間,能做到這個(gè)地步,也實(shí)屬可觀了。

而除了自由度之外,另一個(gè)衡量人形機(jī)器人的指標(biāo),就是其關(guān)節(jié)的“控制扭矩”,

控制扭矩主要決定了機(jī)器人的運(yùn)動(dòng)力量,也就是機(jī)器人能夠產(chǎn)生多大的轉(zhuǎn)動(dòng)力來驅(qū)動(dòng)關(guān)節(jié)和執(zhí)行器。

如果類比成人類的能力,相當(dāng)于人的肌肉力量,就是肌肉產(chǎn)生多大的推拉、舉起、扭轉(zhuǎn)等動(dòng)作的能力。

在這方面,遠(yuǎn)征A1一體化自研的矢量控制驅(qū)動(dòng)器,整體的控制扭矩可以容易地超過350Nm。

而這樣的控制扭矩,則是由智元機(jī)器人自研的PowerFlow關(guān)節(jié)電機(jī)造就的。

PowerFlow關(guān)節(jié)電機(jī)創(chuàng)新性的液冷循環(huán)散熱系統(tǒng),可以有效地將電機(jī)內(nèi)部產(chǎn)生的熱量通過液體傳導(dǎo)到外部的散熱器,從而降低電機(jī)的溫度和阻抗,提高電機(jī)的效率和穩(wěn)定性。

這樣,電機(jī)就可以在更高的功率密度和扭矩下運(yùn)行,而不會過熱或損壞。

同時(shí),PowerFlow關(guān)節(jié)電機(jī)還采用了徑向磁通的外轉(zhuǎn)子電機(jī)方案。

因?yàn)樵谶@樣的方案中,轉(zhuǎn)子組件固定在內(nèi)部,并且磁場方向沿著半徑方向分布,磁場能量更集中,繞組和鐵芯的散熱效果更好。

除此之外,遠(yuǎn)征A1在核心部件上的創(chuàng)新,還包括了指尖傳感器末端的視覺閉環(huán),基于強(qiáng)化學(xué)習(xí)的運(yùn)控算法等。

可以說,正是這一系列的創(chuàng)新,賦予了其自如、靈活的運(yùn)動(dòng)能力。

但如果想與傳統(tǒng)機(jī)器人拉開差距,僅僅有一幅靈巧的身軀是不夠的。

在AI技術(shù)日新月異的當(dāng)下,一個(gè)具備高度智能的“大腦”,就成了具身機(jī)器人必備的組成部分。

02 更智慧的大腦

如果要為傳統(tǒng)機(jī)器人,與當(dāng)下新出現(xiàn)的具身機(jī)器人劃一個(gè)明確的分水嶺,那這樣的分水嶺,則無疑是大模型技術(shù)的應(yīng)用。

傳統(tǒng)的機(jī)器人,指的是那些主要依靠預(yù)先編程和固定規(guī)則來工作的機(jī)器人,它們通常只適合于重復(fù)性、確定性和簡單性的任務(wù),例如工業(yè)生產(chǎn)線上的裝配、搬運(yùn)、焊接等。

在大模型興起之前,傳統(tǒng)機(jī)器人在執(zhí)行各種復(fù)雜任務(wù)時(shí),往往都存在著各種局限與短板。

例如:由于缺乏自適應(yīng)能力,傳統(tǒng)的機(jī)器人很難應(yīng)對環(huán)境和任務(wù)的變化,它們需要經(jīng)常重新編程和調(diào)整,才能適應(yīng)新的情況。

倘若要讓傳統(tǒng)的機(jī)器人從盒子里取出一個(gè)物體,就必須事先告訴它盒子和物體的位置、形狀、大小、重量等信息,否則它可能無法完成任務(wù)。

而大模型與機(jī)器人技術(shù)的結(jié)合,則打破了這以往的限制與弊端。

具備強(qiáng)大的語義理解、邏輯推理、圖像識別的超大參數(shù)大模型,不僅可以讓機(jī)器人編排整個(gè)任務(wù),還能動(dòng)態(tài)調(diào)整任務(wù)。

比如,讓機(jī)器人把桌上垃圾扔到垃圾桶里,不再需要告訴它垃圾是什么、垃圾桶是什么,所有的知識都來自預(yù)訓(xùn)練GPT的模型。

憑借著龐大的先驗(yàn)知識庫和通識理解能力,機(jī)器人就能原有的能力泛化到更通用的場景中。

除此之外,在稚暉君看來,大模型對于機(jī)器人最重要的價(jià)值,就是復(fù)雜語義多級推理能力,所謂的“思維鏈”。

例如,如果要讓一個(gè)機(jī)器人去廚房做一盤煎蛋,它就需要通過思維鏈來理解煎蛋的定義和制作方法,包括所需的原料、工具、步驟等。

同時(shí),它還要分析當(dāng)前的環(huán)境和狀態(tài),包括廚房的布局、物品的位置,規(guī)劃出一條最優(yōu)路徑。

最后,則是按照預(yù)設(shè)的程序或者實(shí)時(shí)的反饋,完成打蛋、下鍋等操作。

這種“思維鏈”能力,可以讓機(jī)器人通過一句簡單的指令,在真實(shí)世界中執(zhí)行一系列復(fù)雜的任務(wù)。而這正是傳統(tǒng)機(jī)器人走向通用機(jī)器人的曙光。

也正因如此,遠(yuǎn)征A1除了可以在汽車產(chǎn)線中從事底盤裝配、外觀檢測等傳統(tǒng)工作外,一個(gè)最大的突破,就是具備了面向C端的陪護(hù)和照看功能。

在家庭場景中,遠(yuǎn)征A1,不但可以在烹飪場景中磕雞蛋,還能照顧老人、幫助老人吃藥,還能幫孩子輔導(dǎo)功課。

通過其強(qiáng)大的語義理解、邏輯推理、圖像識別等能力,大模型可以為機(jī)器人提供一個(gè)統(tǒng)一和高效的思維鏈框架,使其能夠在海量的數(shù)據(jù)上學(xué)習(xí)通用和特定的知識、技能,并在不同的任務(wù)上進(jìn)行遷移和泛化。

03 市場前景

那么,在具備了更靈活的運(yùn)動(dòng)能力、和更強(qiáng)的泛化性、通用性后,具身機(jī)器人的市場前景究竟如何?

或許,從各個(gè)科技巨頭對該領(lǐng)域的相關(guān)布局中,我們就可看到一些端倪。

2022年8月,特斯拉宣布將在該年特斯拉AI day上發(fā)布全尺寸仿生人形機(jī)器人Optimus 。

同月,小米全尺寸人形機(jī)器人CyberOne正式發(fā)布。宣傳片中,昵稱為「鐵大」的機(jī)器?能夠獨(dú)立行走、彎腰,完成抓取等簡單動(dòng)作。

而今年6月,騰訊發(fā)布了旗下機(jī)器人工作室Robotics X研發(fā)的四足機(jī)器人Max的最新視頻。

其自主研發(fā)的多模態(tài)四足機(jī)器人“機(jī)器狗Max”再度得到升級,動(dòng)作、行為都更加接近真實(shí)動(dòng)物。

同樣的,近期華為也成立了“極目機(jī)器”,布局機(jī)器人與智能制造,注冊資本8.7億,經(jīng)營范圍包含電子元器件制造、工程和技術(shù)研究和試驗(yàn)發(fā)展等。

種種跡象表明,眾多巨頭科技公司紛紛看好仿生機(jī)器人,行業(yè)正火熱發(fā)展中。

實(shí)際上,人形AI機(jī)器人的興起,并非僅僅是由于大模型的“火熱”所致,而是科技發(fā)展的內(nèi)在規(guī)律。

正如個(gè)人終端從臺式電腦到個(gè)人電腦,再到手機(jī)的發(fā)展趨勢一樣,每一代終端的迭代,都意味著人類將更多的功能,集合到了統(tǒng)一的平臺中。

時(shí)至今日,手機(jī)幾乎成了這樣一個(gè)平臺的終極形態(tài),因?yàn)槠湓谝粔K小小的屏幕中,集合了人們?nèi)粘K璧馁徫铩⒁曨l、社交、學(xué)習(xí)等各種功能。

然而,人形AI機(jī)器人的出現(xiàn),則填補(bǔ)了此前所有平臺都無法彌補(bǔ)的空缺:即與真實(shí)的物理世界互動(dòng)的能力。

也正因如此,巨頭們相繼推出機(jī)器人產(chǎn)品,并非趕熱點(diǎn),而更多是之前即有的布局。

既然如此,在這場新的產(chǎn)業(yè)競爭格局中,各個(gè)入場玩家們的潛力和競爭態(tài)勢究竟怎樣?

此前,科技媒體量子位,從量產(chǎn)和資本能力兩方面,對目前行業(yè)內(nèi)玩家及現(xiàn)狀進(jìn)行了分析,并繪制了一個(gè)頗為清晰的象限圖。

按照這樣的劃分,國內(nèi)機(jī)器人領(lǐng)域的各個(gè)玩家,大致可分為三個(gè)象限。

第一象限,主要是有強(qiáng)勁資本?撐的明星企業(yè),如騰訊、小米和大疆等。這類企業(yè),往往擁有雄厚的資金、技術(shù),并且具備可觀的量產(chǎn)能力,可以在沒有量產(chǎn)壓力的情況下,不計(jì)成本研發(fā)原型機(jī),推動(dòng)行業(yè)技術(shù)發(fā)展。

第二象限,則是有潛力有技術(shù)的小型公司,這樣的企業(yè)通常都具有?校背景,并且產(chǎn)品專注于某一領(lǐng)域。如從機(jī)器寵物的角度切入的大象機(jī)器人,以及專注與航天、軍工等科研領(lǐng)域的鋼鐵俠科技。

第三象限,則是產(chǎn)品未實(shí)現(xiàn)量產(chǎn),但卻因資本于對其技術(shù)力的高度信任,而獲得大量投資的企業(yè),如開篇提到的智元科技。

從這樣的產(chǎn)業(yè)格局來看,國內(nèi)的機(jī)器人企業(yè),已經(jīng)涵蓋了從高到低,從2B到2C的完整生態(tài)鏈。

而在大模型的賦能下,一個(gè)可預(yù)見的產(chǎn)業(yè)趨勢,則是機(jī)器人會在2C端的服務(wù)領(lǐng)域,向著更多元的方向發(fā)展。

此前,清華?學(xué)交叉信息研究院教授陳建宇曾說:“人形機(jī)器?將是下一代終端。 具身智能機(jī)器人的出現(xiàn)才會是真正的「iPhone」時(shí)刻。”

在國內(nèi)機(jī)器人百花齊放的生態(tài)下,具身機(jī)器人的發(fā)展,就像一場自然界充滿了未知與驚奇的進(jìn)化,當(dāng)參與進(jìn)化的個(gè)體數(shù)量足夠多時(shí),神奇的突變也終將會在某一刻顯現(xiàn)。

       原文標(biāo)題 : 具身智能,開啟機(jī)器人紀(jì)元

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號