訂閱
糾錯(cuò)
加入自媒體

打卡智能中國(guó)(五):博士都去哪兒了?

2023-05-23 09:00
腦極體
關(guān)注

《打卡智能中國(guó)》系列更新了幾期,有讀者表示,很愛(ài)看這類接地氣的真實(shí)故事,也有讀者反映,不是電工,就是文員、農(nóng)民、治沙人,人工智能不是高精尖學(xué)科嗎?那些學(xué)歷很高的博士都去哪兒了?

答案是:他們?cè)诘乩,廠里,礦里呢。

中科院的林博士,我見(jiàn)過(guò)他兩次。

第一次是2020年,某AI精英培訓(xùn)班的開(kāi)學(xué)典禮。當(dāng)時(shí),林博士對(duì)AI的了解,還停留在“深度學(xué)習(xí)的皮毛”,他調(diào)用平臺(tái)的機(jī)器視覺(jué)模型,開(kāi)發(fā)了一個(gè)識(shí)別動(dòng)物的模型,他說(shuō):“可以識(shí)別的種類還比較少,我來(lái)也想看看其他學(xué)員都用AI做些什么工作,跟大家多學(xué)習(xí)。”林博士那次介紹這個(gè)AI產(chǎn)品時(shí),還有些沒(méi)底氣。

第二次是2022年,在一個(gè)普通的會(huì)議室采訪間,林博士的言談內(nèi)容,變得自如和豐富了很多。

“之前的那個(gè)生物識(shí)別應(yīng)用,這幾年已經(jīng)多出了好多個(gè)模型,擴(kuò)展到了哺乳動(dòng)物、兩棲爬行、昆蟲(chóng)科一級(jí)、蝴蝶種一級(jí)的識(shí)別,”他說(shuō),“我們還用AI做了別的事,一個(gè)是野外生物的圖像采集和自動(dòng)化識(shí)別,一個(gè)是通過(guò)聲紋識(shí)別來(lái)進(jìn)行野外動(dòng)物保護(hù),目前設(shè)備已經(jīng)弄好了。我們還支撐別的企業(yè)去做AI商業(yè)化應(yīng)用,比如農(nóng)業(yè)病蟲(chóng)害的識(shí)別”。

兩年時(shí)間,林博士從AI新手成長(zhǎng)為AI熟手,也從一個(gè)坐在電腦前搞研究的學(xué)者,多了很多上深林、下農(nóng)田的經(jīng)驗(yàn)。他眼中的AI,倒映著智能中國(guó)的上限與縱深。

今天的故事,是科研領(lǐng)域的博士,怎么從零開(kāi)始用AI、做AI。

研究所里的AI,有什么不一樣?

科研領(lǐng)域的智能化,與工農(nóng)商等行業(yè)既有相同點(diǎn),也有不同點(diǎn)。

相同點(diǎn)在于:1.缺人;2.缺數(shù);3.缺場(chǎng)景。

科研領(lǐng)域匯聚了大量高學(xué)歷人才,但依然缺少能將AI與細(xì)分學(xué)科相結(jié)合的復(fù)合型人才。就拿林博士來(lái)說(shuō),他本身是信息學(xué)專業(yè)的,因?yàn)樯镅芯恳玫接?jì)算機(jī)分析等信息技術(shù),才加入了中科院下屬的動(dòng)物研究所,對(duì)于深度學(xué)習(xí)、圖像識(shí)別、聲紋識(shí)別等人工智能技術(shù),他也要從頭學(xué)起,迭代自己的知識(shí)體系。

此外,研究型機(jī)構(gòu)大多有一定的數(shù)據(jù)積累,但也分領(lǐng)域、分專業(yè)甚至分物種。比如林博士想做的物種識(shí)別、鳥(niǎo)類聲紋識(shí)別等AI應(yīng)用,很多珍稀動(dòng)物,別說(shuō)語(yǔ)音資料,連野外活動(dòng)的圖像,數(shù)據(jù)庫(kù)里一共都沒(méi)幾張,而缺少充足的數(shù)據(jù),AI很難發(fā)揮作用。

還有,科學(xué)研究的哪些課題、方向能用到AI,這也是一個(gè)需要科學(xué)家們發(fā)揮“主觀能動(dòng)性”去摸索的東西。林博士提到,很多科學(xué)研究中已經(jīng)有很成熟的計(jì)算工具了,要用到AI肯定是要從一線科研人員開(kāi)始推動(dòng),這就需要自己有一定的想法,他說(shuō):“所以我聽(tīng)說(shuō)有這個(gè)深度學(xué)習(xí)人才培訓(xùn),就帶著我的課題主動(dòng)來(lái)報(bào)名了,希望能順利畢業(yè)。”

當(dāng)然,AI+科研也有其特別的地方。

比如,特別沒(méi)錢途。

第一次見(jiàn)面,我好奇地問(wèn),“當(dāng)下AI跟生物的碰撞多不多?”林博士笑言:

“AI在醫(yī)學(xué)領(lǐng)域應(yīng)用的很快,但在生物識(shí)別方面就沒(méi)有那么好,可能跟動(dòng)物保護(hù)這種基礎(chǔ)性研究的商業(yè)價(jià)值不大有關(guān)系,投入上有一定的滯后性。”

玩笑歸玩笑,AI與科研的結(jié)合也特別重要。

林博士的經(jīng)歷證明,基礎(chǔ)研究領(lǐng)域的AI創(chuàng)新一旦成長(zhǎng)起來(lái),可以帶來(lái)產(chǎn)學(xué)研用的一系列聯(lián)動(dòng)效應(yīng)。

2020年,林博士剛剛做出了一款識(shí)別動(dòng)植物的科普類App,集成了計(jì)算機(jī)視覺(jué)技術(shù)和他們單位的動(dòng)植物百科資料,方便一些動(dòng)物愛(ài)好者、野外觀測(cè)調(diào)查員以及小學(xué)生和家長(zhǎng)們使用。

中國(guó)領(lǐng)土廣闊,專家考察有一定的時(shí)間線,比如每五年一次,很可能就會(huì)錯(cuò)失某些物種的觀察機(jī)會(huì),導(dǎo)致采樣到的數(shù)據(jù)是有偏差的。而且生物領(lǐng)域的分類學(xué)家、人才也處于萎縮狀態(tài),越來(lái)越少人愿意從事這樣艱苦的野外工作,所以全靠研究者和野外工作者去采集和分類,是非常不現(xiàn)實(shí)的。

通過(guò)智能技術(shù)的創(chuàng)新應(yīng)用,聚集起更多數(shù)據(jù)合作伙伴,發(fā)動(dòng)機(jī)構(gòu)乃至廣大用戶一起參與進(jìn)來(lái),對(duì)于生物保護(hù)和研究的開(kāi)展很有幫助。

而這樣一個(gè)純公益的工作,隨后也凝聚起了很多研究機(jī)構(gòu)、公益組織以及企業(yè)/產(chǎn)業(yè)界的關(guān)注。

林博士告訴我,開(kāi)發(fā)完那個(gè)App之后,很多類似的國(guó)際動(dòng)物保護(hù)機(jī)構(gòu)跟他們建立了很好的聯(lián)系,他們輸出技術(shù),而對(duì)方將獲取的生物數(shù)據(jù)資料反饋給他們,讓他們獲得了幾十萬(wàn)的影像數(shù)據(jù),其中很多都是新增的觀測(cè)點(diǎn)位,相當(dāng)于給國(guó)家節(jié)省了好多科研經(jīng)費(fèi)。

可持續(xù)的數(shù)據(jù)獲取機(jī)制,對(duì)于后續(xù)科研任務(wù)的開(kāi)展是非常重要的。

除此之外,他們還吸引到了一些商業(yè)化項(xiàng)目方,前來(lái)尋求合作。

比如有企業(yè)知道他們有這個(gè)技術(shù),找到他們想開(kāi)發(fā)一種害蟲(chóng)識(shí)別的系統(tǒng),恰好林博士所在的單位本身也承擔(dān)著病蟲(chóng)害防治工作,有做好糧食安全保障的職能。于是雙方一拍即合,開(kāi)始搭建病蟲(chóng)害的數(shù)據(jù)庫(kù),進(jìn)行識(shí)別算法的開(kāi)發(fā)。

相比跟經(jīng)濟(jì)價(jià)值更近的工農(nóng)商業(yè),科研領(lǐng)域的智能化看起來(lái)好像沒(méi)那么緊迫,卻有著“創(chuàng)新發(fā)動(dòng)機(jī)”的作用:影響的不是一個(gè)人、一家企業(yè),而可能是一個(gè)行業(yè)(比如上文提到的農(nóng)業(yè))、一個(gè)群體(比如科普教育)乃至一個(gè)國(guó)家(比如學(xué)科人才建設(shè))。

從象牙塔到農(nóng)田:一個(gè)博士的腳步

此前報(bào)道中的電力工人、水廠員工都是AI應(yīng)用末端環(huán)節(jié)的一份子。

而借助林博士的腳步,我們可以看到,一種AI能力是如何誕生的又如何抵達(dá)應(yīng)用末端。

第一步:從零做數(shù)據(jù)。

接收到企業(yè)提出的識(shí)別病蟲(chóng)害的需求之后,林博士發(fā)現(xiàn),數(shù)據(jù)就是一個(gè)很大的挑戰(zhàn)。

從生物學(xué)的角度,害蟲(chóng)也有很多種,一種害蟲(chóng)的發(fā)育過(guò)程中還有很多種形態(tài),從蟲(chóng)卵、弱蟲(chóng)、幼蟲(chóng)、成蟲(chóng)的發(fā)育狀態(tài)都不同,在圖像分類過(guò)程中就屬于不同類別,如果是外行人來(lái)做,根本做不明白也沒(méi)有一個(gè)成型的數(shù)據(jù)庫(kù)。

所以林博士和團(tuán)隊(duì),必須從電腦桌前走到地里,去實(shí)地采集不同階段的圖像,確定病蟲(chóng)害不同發(fā)育階段的形狀特征,為后續(xù)模型的精準(zhǔn)識(shí)別打下基礎(chǔ)。

第二步:跟農(nóng)業(yè)專家深入交流。

不同地區(qū)的病蟲(chóng)害可能并不相同,里面涉及到很多非常專業(yè)的知識(shí)點(diǎn),比如北京郊區(qū)的番茄有哪些常見(jiàn)的病蟲(chóng)害?發(fā)現(xiàn)害蟲(chóng)后會(huì)對(duì)接怎樣的防治措施?提供什么藥物?這都要深入到大棚里,跟當(dāng)?shù)氐闹脖<乙约伴L(zhǎng)期從事一線生產(chǎn)的農(nóng)民們進(jìn)行交流,這樣才能保證后期打造的AI系統(tǒng),能夠提供從病蟲(chóng)害識(shí)別到防治指導(dǎo)的全套工作。

第三步:模型開(kāi)發(fā)與調(diào)優(yōu)迭代。

林博士和同事們基本都是信息學(xué)專業(yè),并不是深度學(xué)習(xí)算法工程師出身,而農(nóng)業(yè)項(xiàng)目的模型迭代又很快,一批圖像采集完了之后,馬上就要迭代一批模型,為了精準(zhǔn)識(shí)別不同作物,還要開(kāi)發(fā)不同的模型,這樣模型很多,開(kāi)發(fā)和迭代工作量很大。

林博士表示,科研工作中可能很看重AI開(kāi)發(fā)框架的靈活性、可擴(kuò)展性、先進(jìn)性等,比如為了發(fā)paper便于同行復(fù)現(xiàn),大家更傾向于使用TensorFlow、PyTorch這樣的海外平臺(tái),而真正在開(kāi)發(fā)產(chǎn)業(yè)用模型時(shí),我們更看重的是平臺(tái)的易用性,以及面向應(yīng)用的工業(yè)化能力是不是很簡(jiǎn)單易用,有沒(méi)有已經(jīng)訓(xùn)練好的性能不錯(cuò)的模型。

因?yàn)榈讓拥募夹g(shù)手段、理論方法,國(guó)內(nèi)外開(kāi)發(fā)平臺(tái)都是一樣的,也都是開(kāi)源的,沒(méi)什么區(qū)別,但容不容易訓(xùn)練,容不容易部署,能不能工業(yè)性地批量生產(chǎn)(模型),這些問(wèn)題的答案對(duì)產(chǎn)業(yè)智能化很重要。

目前,由林博士及團(tuán)隊(duì)支持的該農(nóng)業(yè)病蟲(chóng)害應(yīng)用已經(jīng)在北京落地了,這也是北方地區(qū)第一款病蟲(chóng)害識(shí)別的App。

為什么做這個(gè)項(xiàng)目?林博士及團(tuán)隊(duì)的出發(fā)點(diǎn)和商業(yè)公司的想法就不太一樣——一方面是企業(yè)/農(nóng)戶有需求;另一方面是為了幫助新農(nóng)人。

“現(xiàn)在大量的新型農(nóng)業(yè)生產(chǎn)者,比如年輕一代,”林博士提到,“他們沒(méi)有熟練的生產(chǎn)經(jīng)驗(yàn),也不依賴上一輩傳授的經(jīng)驗(yàn),而是更依賴從互聯(lián)網(wǎng)獲取的信息。這時(shí)候我們給他提供一個(gè)工具——AI識(shí)別,慢慢地他們也會(huì)成長(zhǎng)為有經(jīng)驗(yàn)的生產(chǎn)者。”

以往《打卡智能中國(guó)》的主角,電力工人放飛的無(wú)人機(jī),水廠員工日常使用的智慧系統(tǒng),這些AI工具背后就是無(wú)數(shù)個(gè)林博士。

學(xué)員?導(dǎo)師?研究員?開(kāi)發(fā)者?一個(gè)AI人的身份轉(zhuǎn)換

第一次見(jiàn)到林博士,他還是一個(gè)帶著課題等待被評(píng)判的“AI新手學(xué)員”。

第二次見(jiàn)到他,已經(jīng)是國(guó)內(nèi)某AI開(kāi)源社區(qū)的技術(shù)專家了。

林博士平時(shí)還會(huì)承擔(dān)一些新手指導(dǎo)、開(kāi)發(fā)經(jīng)驗(yàn)分享等任務(wù),把自己的數(shù)據(jù)和模型開(kāi)源放到平臺(tái)上,讓開(kāi)發(fā)者和學(xué)生用戶有實(shí)踐和練手的機(jī)會(huì)。

培養(yǎng)多一點(diǎn)AI人才,這種“利他”的思維,好像就刻在這位學(xué)者的腦子里,不用猶豫和思索,自然而然地就去做了。

AI人才需求量大、缺口大,已經(jīng)是公認(rèn)的事實(shí),也成為人工智能產(chǎn)業(yè)進(jìn)一步繁榮發(fā)展的限制。

AI人才的培養(yǎng)難,一是因?yàn)榧夹g(shù)新,相較于理數(shù)生化等傳統(tǒng)學(xué)科,以及計(jì)算機(jī)這樣的成熟學(xué)科來(lái)說(shuō),AI本身是一門新興技術(shù),還在不斷更新迭代,沒(méi)有完善的人才培養(yǎng)模式和課程體系;二是交叉性強(qiáng),AI是一門應(yīng)用型技術(shù),要求跟產(chǎn)業(yè)緊密結(jié)合、實(shí)踐落地,僅靠學(xué)校教育是無(wú)法滿足AI復(fù)合型人才的培養(yǎng)需求。

十四五規(guī)劃中提出,人工智能行業(yè)要形成產(chǎn)學(xué)研用深度融合的技術(shù)創(chuàng)新體系,連通企業(yè)、高校、研究院所、政府等創(chuàng)新主體。

在AI生態(tài)里,“產(chǎn)學(xué)研用”是分層的,每一層都承擔(dān)著各自主要的創(chuàng)新任務(wù),但分層不代表割裂,各層還要緊密聯(lián)動(dòng),擰成一個(gè)創(chuàng)新鏈條。

“林博士們”就成了那個(gè)游走在各層的關(guān)鍵角色:

在產(chǎn)業(yè)中,他們是AI創(chuàng)新的開(kāi)發(fā)者;

在高校人才培養(yǎng)中,他們是那個(gè)給學(xué)弟、學(xué)妹指導(dǎo)的前輩;

在研究中,他們是將AI技術(shù)與科學(xué)探索相結(jié)合的先行者;

在應(yīng)用環(huán)節(jié),他們會(huì)主動(dòng)去貼近一線使用者,讓AI工具能變得更好用。

“談笑有鴻儒,往來(lái)無(wú)白丁”這就是今天的AI學(xué)人,既有身處象牙塔兼濟(jì)天下的理想情懷,又有身先士卒深入產(chǎn)業(yè)的行動(dòng)能力。

有一個(gè)工業(yè)大學(xué)的老師曾告訴我,要把AI研究做到工廠里,這和林博士把AI做進(jìn)農(nóng)田里,有異曲同工之妙。

這些學(xué)者擁抱AI的經(jīng)歷,讓我深切的感受到:AI既是一個(gè)專業(yè),也不是一個(gè)專業(yè)。AI將更多專家和學(xué)者拉進(jìn)AI的世界,“產(chǎn)學(xué)研用”的閉環(huán)加速轉(zhuǎn)動(dòng),才能持續(xù)打開(kāi)AI的上限和想象空間。

大鵬之動(dòng),非一羽之輕也,多元人才的合力,才能托舉起智能中國(guó)。

       原文標(biāo)題 : 打卡智能中國(guó)(五):博士都去哪兒了?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)