訂閱
糾錯(cuò)
加入自媒體

盤點(diǎn)2019年全球十大AI芯片,國(guó)產(chǎn)芯片全面崛起!

人工智能浪潮的推動(dòng)下,AI相關(guān)產(chǎn)業(yè)的商用場(chǎng)景正逐步大規(guī)模落地,基于AI技術(shù)的三大支柱:“算法+大數(shù)據(jù)+計(jì)算能力”智能應(yīng)用已成為計(jì)算機(jī)最主要的負(fù)載之一。我國(guó)在用戶數(shù)據(jù)方面擁有數(shù)量的先天優(yōu)勢(shì),但面對(duì)有限的規(guī)模、結(jié)構(gòu)固定、能耗受限的硬件制約下,如何用AI芯片處理海量的并不斷演進(jìn)的深度學(xué)習(xí)算法呢?跟隨OFweek編輯一起來(lái)看看各大科技巨頭們研發(fā)的AI芯片吧。(排名按首字母順序排列)

1.含光800

2019年的杭州云棲大會(huì)上,達(dá)摩院院長(zhǎng)張建鋒現(xiàn)場(chǎng)展示了這款全球最強(qiáng)的 AI芯片——含光800。在業(yè)界標(biāo)準(zhǔn)的 ResNet-50 測(cè)試中,含光 800 推理性能達(dá)到 78563 IPS,比目前業(yè)界最好的 AI 芯片性能高 4 倍;能效比500 IPS/W,一個(gè)含光800的算力相當(dāng)于10個(gè)GPU。

目前,含光800已經(jīng)實(shí)現(xiàn)了大規(guī)模應(yīng)用于阿里巴巴集團(tuán)內(nèi)多個(gè)場(chǎng)景,例如視頻圖像識(shí)別/分類/搜索、城市大腦等,未來(lái)還可應(yīng)用于醫(yī)療影像、自動(dòng)駕駛等領(lǐng)域。以杭州城市大腦實(shí)時(shí)處理1000路視頻為例,過(guò)去使用GPU需要40塊,延時(shí)為300ms,單路視頻功耗2.8W;使用含光800僅需4塊,延時(shí)150ms,單路視頻功耗1W。

2.Graphcore IPU

總部位于英國(guó)布里斯托的Graphcore公司日前推出了一款稱為智能處理單元(IPU)的新型AI加速處理器。芯片本身,即IPU處理器,是迄今為止最復(fù)雜的處理器芯片:它在一個(gè)16納米芯片上有幾乎240億個(gè)晶體管,每個(gè)芯片提供125 teraFLOPS運(yùn)算能力。一個(gè)標(biāo)準(zhǔn)4U機(jī)箱中可插入8張卡,卡間通過(guò)IPU鏈路互連。8張卡中的IPU可以作為一個(gè)處理器元件工作,提供兩個(gè)petaFLOPS的運(yùn)算能力。與芯片在CPU和GPU中的存在形式不同,它為機(jī)器智能提供了更高效的處理平臺(tái)。

Graphcore公司于2016年啟動(dòng)風(fēng)險(xiǎn)投資計(jì)劃,并在2018年12月的最后一輪融資中募集了2億美元;谄17億美元的公司估值,Graphcore已成為西方半導(dǎo)體界的唯一“獨(dú)角獸”。它的投資者們包括戴爾、博世、寶馬、微軟和三星。

3.Inferentia芯片

2019年,亞馬遜的云服務(wù)業(yè)務(wù)AWS在其發(fā)布會(huì)AWS re:Invent上帶來(lái)了高性能機(jī)器學(xué)習(xí)加速芯片Inferentia。據(jù)了解,AWS Inferentia 是一個(gè)由 AWS 定制設(shè)計(jì)的機(jī)器學(xué)習(xí)推理芯片,旨在以極低成本交付高吞吐量、低延遲推理性能。該芯片將支持 TensorFlow、Apache MXNet 和 PyTorch 深度學(xué)習(xí)框架以及使用 ONNX 格式的模型。

每個(gè) AWS Inferentia 芯片都能在低功率下支持高達(dá) 128 TOPS(每秒數(shù)萬(wàn)億次運(yùn)行)的性能,從而為每個(gè) EC2 實(shí)例啟用多個(gè)芯片。AWS Inferentia 支持 FP16、BF16 和 INT8 數(shù)據(jù)類型。此外,Inferentia 可以采用 32 位訓(xùn)練模型,并使用 BFloat16 以 16 位模型的速度運(yùn)行該模型。與EC4上的常規(guī)Nvidia G4實(shí)例相比,借助Inferentia,AWS可提供更低的延遲和三倍的吞吐量,且每次推理成本降低40%。

4.昆侖芯片
   2019年尾聲,百度宣布首款A(yù)I芯片昆侖已經(jīng)完成研發(fā),將由三星代工生產(chǎn)。該芯片使用的是三星14nm工藝技術(shù),封裝解決方案采用的是I-Cube TM。

據(jù)悉,昆侖AI芯片提供512Gbps的內(nèi)存帶寬,在150瓦的功率下實(shí)現(xiàn)260TOPS的處理能力,能支持語(yǔ)音,圖像,NLP等不同的算法模型,其中ERNIE模型的性能是T4GPU的三倍以上,兼容百度飛槳等主流深度學(xué)習(xí)框架。該款芯片主要用于云計(jì)算和邊緣計(jì)算,預(yù)計(jì)在2020年初實(shí)現(xiàn)量產(chǎn),

5.Nervana NNP 芯片

2019 英特爾人工智能峰會(huì),英特爾推出面向訓(xùn)練 (NNP-T1000) 和面向推理 (NNP-I1000) 的英特爾 Nervana 神經(jīng)網(wǎng)絡(luò)處理器 (NNP)。據(jù)了解,Nervana NNP-T 代號(hào) Spring Crest,采用了臺(tái)積電的 16nm FF+ 制程工藝,擁有 270 億個(gè)晶體管,硅片面積 680 平方毫米,能夠支持 TensorFlow、PaddlePaddle、PYTORCH 訓(xùn)練框架,也支持 C++ 深度學(xué)習(xí)軟件庫(kù)和編譯器 nGraph。

Nervana NNP-I,代號(hào)為 Spring Hill,是一款專門用于大型數(shù)據(jù)中心的推理芯片。這款芯片是基于 10nm 技術(shù)和 Ice Lake 內(nèi)核打造的,打造地點(diǎn)是以色列的 Haifa ,Intel 號(hào)稱它能夠利用最小的能量來(lái)處理高負(fù)載的工作,它在 ResNet50 的效率可達(dá) 4.8TOPs/W,功率范圍在 10W 到 50W 之間。

6.Orin芯片

2019年NVIDIA GTC中國(guó)大會(huì)中英偉達(dá)發(fā)布了全新的軟件定義自動(dòng)駕駛平臺(tái)——NVIDIA DRIVE AGX Orin,該平臺(tái)內(nèi)置全新Orin系統(tǒng)級(jí)芯片,由170億個(gè)晶體管組成。

Orin系統(tǒng)級(jí)芯片集成了NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器,每秒可運(yùn)行200萬(wàn)億次計(jì)算,幾乎是NVIDIA上一代Xavier系統(tǒng)級(jí)芯片性能的7倍。此外,Orin可處理在自動(dòng)駕駛汽車和機(jī)器人中同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了ISO 26262 ASIL-D等系統(tǒng)安全標(biāo)準(zhǔn)。

7.邃思DTU

由騰訊領(lǐng)投、融資累計(jì)超過(guò) 6 億元的 AI 芯片公司燧原科技,在2019年發(fā)布會(huì)中推出自主研發(fā)的首款 AI 訓(xùn)練芯片“邃思 DTU”。

據(jù)了解邃思DTU采用格羅方德12nm FinFET工藝,480平方毫米主芯片上承載141億個(gè)晶體管,實(shí)現(xiàn)2.5D高級(jí)立體封裝,據(jù)稱單卡單精度算力為業(yè)界第一,達(dá)20TFLOPS,首次支持混合精度,半精度及混合精度下算力達(dá)80TFLOPS,最大功耗僅225W。

邃思芯片基于可重構(gòu)芯片的設(shè)計(jì)理念,其計(jì)算核心包含 32 個(gè)通用可擴(kuò)展神經(jīng)元處理器(SIP),每 8 個(gè) SIP 組合成 4 個(gè)可擴(kuò)展智能計(jì)算群(SIC)。SIC 之間通過(guò) HBM 實(shí)現(xiàn)高速互聯(lián),通過(guò)片上調(diào)度算法,數(shù)據(jù)在遷移中完成計(jì)算,實(shí)現(xiàn)了 SIP 利用率最大化。

8.思元220芯片

寒武紀(jì)在第21屆高交會(huì)正式發(fā)布邊緣AI系列產(chǎn)品思元220(MLU220)芯片及M.2加速卡產(chǎn)品,標(biāo)志寒武紀(jì)在云、邊、端實(shí)現(xiàn)了全方位、立體式的覆蓋。

思元220芯片采用了寒武紀(jì)在處理器架構(gòu)領(lǐng)域的一系列創(chuàng)新性技術(shù),其架構(gòu)為寒武紀(jì)最新一代智能處理器MLUv02,實(shí)現(xiàn)最大32TOPS(INT4)算力,而功耗僅10W,可提供16/8/4位可配置的定點(diǎn)運(yùn)算。作為通用處理器,支持各類深度學(xué)習(xí)技術(shù),支持多模態(tài)智能處理(視覺(jué)、語(yǔ)音和自然語(yǔ)言處理),應(yīng)用領(lǐng)域廣泛,客戶可以根據(jù)實(shí)際應(yīng)用靈活的選擇運(yùn)算類型來(lái)獲得卓越的人工智能推理性能。

9.昇騰910

2019年8月,華為在深圳總部發(fā)布AI處理器Ascend 910(昇騰910),據(jù)華為發(fā)布的參數(shù)顯示,昇騰910是一款具有超高算力的AI處理器,其最大功耗為310W,華為自研的達(dá)芬奇架構(gòu)大大提升了其能效比。八位整數(shù)精度(INT8)下的性能達(dá)到512TOPS,16位浮點(diǎn)數(shù)(FP16)下的性能達(dá)到256 TFLOPS。

作為一款高集成度的片上系統(tǒng)(SoC),除了基于達(dá)芬奇架構(gòu)的AI核外,昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢(shì)。

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構(gòu)建橫向擴(kuò)展(Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。

10.征程二代

2019世界人工智能大會(huì)中,人工智能芯片初創(chuàng)公司地平線正式宣布量產(chǎn)中國(guó)首款車規(guī)級(jí)人工智能芯片——征程二代,并且獲得五個(gè)國(guó)家市場(chǎng)客戶的前裝定點(diǎn)項(xiàng)目。

據(jù)介紹,征程二代于今年初流片成功,搭載地平線自主創(chuàng)新研發(fā)的高性能計(jì)算架構(gòu)BPU2.0(Brain Processing Unit),可提供超過(guò)4TOPS的等效算力,典型功耗僅2瓦,滿足AEC-Q100標(biāo)準(zhǔn),算力利用率超過(guò)90%,每TOPS算力可以處理的幀數(shù)可達(dá)同等算力GPU的10倍以上,識(shí)別精度超過(guò)99%,延遲少于100毫秒,多任務(wù)模式下可以同時(shí)跑超過(guò)60個(gè)分類任務(wù),每秒鐘識(shí)別目標(biāo)數(shù)可以超過(guò)2000個(gè)。

此次地平線率先推出首款車規(guī)級(jí)AI芯片不僅實(shí)現(xiàn)了中國(guó)車規(guī)級(jí)AI芯片量產(chǎn)零的突破,也補(bǔ)齊了國(guó)內(nèi)自動(dòng)駕駛產(chǎn)業(yè)生態(tài)建設(shè)的關(guān)鍵環(huán)節(jié)。

小結(jié)

目前通過(guò)CPU/GPU處理人工神經(jīng)網(wǎng)絡(luò)效率低下,谷歌大腦需要1.6萬(wàn)個(gè)CPU核跑數(shù)天方能完成貓臉識(shí)別訓(xùn)練;AIpha GO與李世石下棋時(shí)用了1000個(gè)CPU和200個(gè)GPU,AI芯片的發(fā)展是第三次AI浪潮中極為明顯的趨勢(shì),算法已滲透到云服務(wù)器和智能手機(jī)的方方面面,未來(lái)每臺(tái)計(jì)算機(jī)可能都需要一個(gè)專門的深度學(xué)習(xí)處理器。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮瑒(wù)經(jīng)書(shū)面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)