訂閱
糾錯(cuò)
加入自媒體

讓內(nèi)存干CPU的活兒 這項(xiàng)技術(shù)將芯片運(yùn)行速度提升百倍

近日,美國(guó)普林斯頓大學(xué)研究人員推出了一款新型計(jì)算機(jī)芯片,其運(yùn)行速度是傳統(tǒng)芯片的百倍。有媒體稱其采用了“內(nèi)存計(jì)算”技術(shù),使計(jì)算效率得到大幅提升。

這一神奇的技術(shù)到底是什么?它為何能顯著提高芯片性能?科技日?qǐng)?bào)記者就此采訪了相關(guān)專家。

高度集成,把計(jì)算與存儲(chǔ)功能合二為一

對(duì)于我們常用的計(jì)算機(jī)來(lái)說(shuō),存儲(chǔ)器可分為內(nèi)部存儲(chǔ)器和外部存儲(chǔ)器。內(nèi)部存儲(chǔ)器,即“內(nèi)存”,是電腦的主存儲(chǔ)器。它的存取速度快,但只能儲(chǔ)存臨時(shí)或少量的數(shù)據(jù)和程序。

外部存儲(chǔ)器,通常被稱為“外存”,它包括硬盤、軟盤、光盤、U盤等,通常可永久存儲(chǔ)大量數(shù)據(jù),如操作系統(tǒng)、應(yīng)用程序等。當(dāng)運(yùn)行某一程序時(shí),處理器(CPU)會(huì)先從內(nèi)存中讀取數(shù)據(jù),而后將一部分結(jié)果寫入內(nèi)存,并選擇性地將另一部分結(jié)果寫入外存進(jìn)行永久保存。

也就是說(shuō),通常情況下,內(nèi)存只能存儲(chǔ)少量數(shù)據(jù),計(jì)算機(jī)中大部分?jǐn)?shù)據(jù)都“住”在外存。當(dāng)CPU運(yùn)行程序時(shí)就需要調(diào)取數(shù)據(jù),若調(diào)取“住”在內(nèi)存的數(shù)據(jù),則用時(shí)較少;若調(diào)取“住”在外存的數(shù)據(jù),則可能要費(fèi)些周折。

因此科學(xué)家就想,能否把數(shù)據(jù)都存在內(nèi)存里呢?于是,內(nèi)存計(jì)算技術(shù)出現(xiàn)了。

“內(nèi)存計(jì)算技術(shù)是伴隨著大數(shù)據(jù)處理技術(shù)的興起而興盛起來(lái)的。在處理大數(shù)據(jù)過(guò)程中,由于數(shù)據(jù)量極大,處理數(shù)據(jù)時(shí)頻繁訪問(wèn)硬盤這些外存會(huì)降低運(yùn)算速度。隨著大容量?jī)?nèi)存技術(shù)的興起,專家開始提出在初始階段就把數(shù)據(jù)全部加載到內(nèi)存中,而后可直接把數(shù)據(jù)從內(nèi)存中調(diào)取出來(lái),再由處理器進(jìn)行計(jì)算。這樣可以省去外存與內(nèi)存之間的數(shù)據(jù)調(diào)入/調(diào)出過(guò)程,從而大大提升計(jì)算速度。”北京航空航天大學(xué)計(jì)算機(jī)學(xué)院教授、中德聯(lián)合軟件研究所所長(zhǎng)劉軼告訴科技日?qǐng)?bào)記者。

“但普林斯頓大學(xué)研發(fā)團(tuán)隊(duì)采用的‘內(nèi)存計(jì)算’技術(shù)與上述概念中所指的內(nèi)存計(jì)算并不完全相同。”劉軼說(shuō),普林斯頓大學(xué)所采用的技術(shù)其實(shí)是PIM(Process in-memory),通常被翻譯為“存內(nèi)計(jì)算”“存算一體”或“計(jì)算存儲(chǔ)一體化”。

“PIM技術(shù)是指直接在內(nèi)存中處理數(shù)據(jù),而不是把數(shù)據(jù)從內(nèi)存讀取到處理器中進(jìn)行處理。”劉軼指出,PIM的技術(shù)概念在1990年就已被提出,雖然相關(guān)研究論文早已發(fā)表出來(lái),但相關(guān)技術(shù)始終難以落地。

劉軼認(rèn)為“難落地”的主要原因在于,PIM技術(shù)尚難以達(dá)到傳統(tǒng)計(jì)算機(jī)馮·諾依曼結(jié)構(gòu)的靈活性和通用性水平!澳壳,學(xué)界所提出的PIM技術(shù),只能做某些類別的應(yīng)用,難以實(shí)現(xiàn)靈活編程。”他說(shuō)。

可解決“存儲(chǔ)墻”問(wèn)題,大幅提升性能

在劉軼看來(lái),PIM技術(shù)的重要價(jià)值在于,其能解決傳統(tǒng)計(jì)算機(jī)結(jié)構(gòu)存在的“存儲(chǔ)墻”問(wèn)題。傳統(tǒng)計(jì)算機(jī)采用的馮·諾依曼結(jié)構(gòu),需要CPU從內(nèi)存中取出指令并且執(zhí)行,某些指令又需要從內(nèi)存讀取數(shù)據(jù)進(jìn)行處理,再將結(jié)果寫回內(nèi)存。由于處理器所執(zhí)行的程序和待處理的數(shù)據(jù)都被存在內(nèi)存中,這樣處理器在運(yùn)行過(guò)程中需要頻繁訪問(wèn)內(nèi)存。隨著微電子技術(shù)的發(fā)展,處理器性能的進(jìn)步速度逐漸快于內(nèi)存性能。

近30年來(lái),處理器性能每年提升55%,而內(nèi)存訪問(wèn)速度每年僅提升7%。這使得處理器的處理速度遠(yuǎn)遠(yuǎn)快于內(nèi)存的讀取速度,直接導(dǎo)致了“存儲(chǔ)墻”的出現(xiàn),嚴(yán)重拖慢了程序執(zhí)行速度。

“這好比一個(gè)人消化能力很強(qiáng),飯桌上也有很多食物,但這個(gè)人的嗓子眼兒很細(xì),咽不下去。這就使得強(qiáng)大的消化能力‘無(wú)用武之地’,也限制了這個(gè)人吃東西的速度!眲⑤W說(shuō)。

“近年來(lái)深度學(xué)習(xí)等新型算法的興起,對(duì)推倒‘存儲(chǔ)墻’提出了更迫切的需求!眲⑤W指出,新型算法訪問(wèn)內(nèi)存的模式跟傳統(tǒng)模式不太相同,刷臉、圖片識(shí)別、機(jī)器翻譯等新型算法往往以類似于人腦的方式實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)的處理。由于這類算法涉及的神經(jīng)元數(shù)量多、訓(xùn)練樣本量大,這導(dǎo)致在通用計(jì)算機(jī)上進(jìn)行深度學(xué)習(xí)計(jì)算的效率比較低。

為了提高效率,科研人員開發(fā)了各種加速部件和專用的深度學(xué)習(xí)處理器,前者的典型代表是圖形處理器(GPU),后者的典型代表有谷歌公司的張量處理器(TPU)、國(guó)內(nèi)的寒武紀(jì)處理器等。

“CPU、GPU等處理器通過(guò)總線與內(nèi)存相連,總線的傳輸速度決定了計(jì)算的效率。”中國(guó)自動(dòng)化學(xué)會(huì)混合智能專業(yè)委員會(huì)副主任、復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院教授張軍平告訴科技日?qǐng)?bào)記者,人們正在嘗試通過(guò)改進(jìn),減少數(shù)據(jù)在總線上的傳輸次數(shù),提高計(jì)算效率。例如,科研人員讓CPU具備部分的GPU功能,或使GPU具備一些CPU的功能等。

劉軼表示,上述改進(jìn)措施仍然屬于馮·諾依曼結(jié)構(gòu),不能從根本上解決“存儲(chǔ)墻”問(wèn)題。相比之下,PIM技術(shù)在解決“存儲(chǔ)墻”問(wèn)題上更具優(yōu)勢(shì)。首先,它的計(jì)算模式更適合深度學(xué)習(xí)等新型計(jì)算模式;其次,PIM技術(shù)避免了馮·諾依曼結(jié)構(gòu)處理器頻繁訪問(wèn)內(nèi)存這一問(wèn)題,減少了數(shù)據(jù)傳輸次數(shù),降低了功耗。

具有發(fā)展?jié)摿Γ须y取代通用處理器

記者通過(guò)查閱資料發(fā)現(xiàn),PIM技術(shù)應(yīng)用最大的難點(diǎn)在于制造工藝。

PIM技術(shù)需要利用先進(jìn)的半導(dǎo)體工藝將處理器和存儲(chǔ)器集成在同一芯片內(nèi),使之通過(guò)片上網(wǎng)絡(luò)相互連接。但由于目前處理器與存儲(chǔ)器的制造工藝不同,若要在處理器上實(shí)現(xiàn)存儲(chǔ)器的功能,則可能會(huì)降低存儲(chǔ)器的存儲(chǔ)密度;若要在存儲(chǔ)器上實(shí)現(xiàn)處理器的功能,則可能會(huì)影響處理器的運(yùn)行速度。

張軍平指出,現(xiàn)階段內(nèi)存本身不具備計(jì)算功能,因此若想實(shí)現(xiàn)內(nèi)存計(jì)算或PIM技術(shù)都需要對(duì)內(nèi)存進(jìn)行重新設(shè)計(jì)。

“普林斯頓大學(xué)不是專業(yè)的芯片公司,其推出的新型芯片可能只是一種技術(shù)上的探索,離真正的產(chǎn)業(yè)化應(yīng)用還有相當(dāng)長(zhǎng)的距離。”張軍平認(rèn)為,隨著固態(tài)硬盤等技術(shù)的發(fā)展,如果硬盤讀寫速度足以媲美內(nèi)存,內(nèi)存與外存可能被集成為新型大容量高速存儲(chǔ)器。未來(lái)最理想的情況是,CPU、GPU等多種處理器與大容量高速存儲(chǔ)器實(shí)現(xiàn)一體化高度集成。

劉軼強(qiáng)調(diào),普林斯頓大學(xué)設(shè)計(jì)的這種處理器是一種專用處理器,它只針對(duì)深度學(xué)習(xí)應(yīng)用,無(wú)法取代傳統(tǒng)的通用處理器。

“正如華為、蘋果等公司推出的高端手機(jī)上大多配置了深度學(xué)習(xí)處理器,但只作為附屬部件,核心的計(jì)算和處理仍然由通用處理器來(lái)完成,只是把特定的任務(wù)和計(jì)算模塊交由深度學(xué)習(xí)處理器來(lái)進(jìn)行計(jì)算,而且是在通用處理器的控制之下完成的!眲⑤W說(shuō)。

“短期來(lái)看,PIM技術(shù)只能被用于特定類別的應(yīng)用場(chǎng)景,難以取代通用處理器!眲⑤W認(rèn)為,從長(zhǎng)遠(yuǎn)來(lái)看,如果半導(dǎo)體材料和器件技術(shù)無(wú)法取得突破,集成電路的摩爾定律將在不久的未來(lái)失效,即集成電路芯片內(nèi)的晶體管數(shù)量將停止增長(zhǎng)。這會(huì)對(duì)傳統(tǒng)的計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)乃至計(jì)算機(jī)硬件和軟件產(chǎn)業(yè)造成巨大的影響,由此也很可能引發(fā)重大的技術(shù)變革。當(dāng)新的計(jì)算結(jié)構(gòu)出現(xiàn)時(shí),高度集成化的系統(tǒng)可能會(huì)對(duì)PIM技術(shù)有更多需求,但該技術(shù)能否成為主流仍有待觀察。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)