伊人思思久99久女女精品视频,又黄又爽又硬网站

盤點(diǎn)2019年全球十大AI芯片，國(guó)產(chǎn)芯片全面崛起！

2019-12-23 19:10

人工智能浪潮的推動(dòng)下，AI相關(guān)產(chǎn)業(yè)的商用場(chǎng)景正逐步大規(guī)模落地，基于AI技術(shù)的三大支柱：“算法＋大數(shù)據(jù)＋計(jì)算能力”智能應(yīng)用已成為計(jì)算機(jī)最主要的負(fù)載之一。我國(guó)在用戶數(shù)據(jù)方面擁有數(shù)量的先天優(yōu)勢(shì)，但面對(duì)有限的規(guī)模、結(jié)構(gòu)固定、能耗受限的硬件制約下，如何用AI芯片處理海量的并不斷演進(jìn)的深度學(xué)習(xí)算法呢？跟隨OFweek編輯一起來(lái)看看各大科技巨頭們研發(fā)的AI芯片吧。（排名按首字母順序排列）

1.含光800

2019年的杭州云棲大會(huì)上，達(dá)摩院院長(zhǎng)張建鋒現(xiàn)場(chǎng)展示了這款全球最強(qiáng)的 AI芯片——含光800。在業(yè)界標(biāo)準(zhǔn)的 ResNet－50 測(cè)試中，含光 800 推理性能達(dá)到 78563 IPS，比目前業(yè)界最好的 AI 芯片性能高 4 倍；能效比500 IPS／W，一個(gè)含光800的算力相當(dāng)于10個(gè)GPU。

目前，含光800已經(jīng)實(shí)現(xiàn)了大規(guī)模應(yīng)用于阿里巴巴集團(tuán)內(nèi)多個(gè)場(chǎng)景，例如視頻圖像識(shí)別／分類／搜索、城市大腦等，未來(lái)還可應(yīng)用于醫(yī)療影像、自動(dòng)駕駛等領(lǐng)域。以杭州城市大腦實(shí)時(shí)處理1000路視頻為例，過(guò)去使用GPU需要40塊，延時(shí)為300ms，單路視頻功耗2．8W；使用含光800僅需4塊，延時(shí)150ms，單路視頻功耗1W。

2.Graphcore IPU

總部位于英國(guó)布里斯托的Graphcore公司日前推出了一款稱為智能處理單元（IPU）的新型AI加速處理器。芯片本身，即IPU處理器，是迄今為止最復(fù)雜的處理器芯片：它在一個(gè)16納米芯片上有幾乎240億個(gè)晶體管，每個(gè)芯片提供125 teraFLOPS運(yùn)算能力。一個(gè)標(biāo)準(zhǔn)4U機(jī)箱中可插入8張卡，卡間通過(guò)IPU鏈路互連。8張卡中的IPU可以作為一個(gè)處理器元件工作，提供兩個(gè)petaFLOPS的運(yùn)算能力。與芯片在CPU和GPU中的存在形式不同，它為機(jī)器智能提供了更高效的處理平臺(tái)。

Graphcore公司于2016年啟動(dòng)風(fēng)險(xiǎn)投資計(jì)劃，并在2018年12月的最后一輪融資中募集了2億美元�；谄�17億美元的公司估值，Graphcore已成為西方半導(dǎo)體界的唯一“獨(dú)角獸”。它的投資者們包括戴爾、博世、寶馬、微軟和三星。

3.Inferentia芯片

2019年，亞馬遜的云服務(wù)業(yè)務(wù)AWS在其發(fā)布會(huì)AWS re：Invent上帶來(lái)了高性能機(jī)器學(xué)習(xí)加速芯片Inferentia。據(jù)了解，AWS Inferentia 是一個(gè)由 AWS 定制設(shè)計(jì)的機(jī)器學(xué)習(xí)推理芯片，旨在以極低成本交付高吞吐量、低延遲推理性能。該芯片將支持 TensorFlow、Apache MXNet 和 PyTorch 深度學(xué)習(xí)框架以及使用 ONNX 格式的模型。

每個(gè) AWS Inferentia 芯片都能在低功率下支持高達(dá) 128 TOPS（每秒數(shù)萬(wàn)億次運(yùn)行）的性能，從而為每個(gè) EC2 實(shí)例啟用多個(gè)芯片。AWS Inferentia 支持 FP16、BF16 和 INT8 數(shù)據(jù)類型。此外，Inferentia 可以采用 32 位訓(xùn)練模型，并使用 BFloat16 以 16 位模型的速度運(yùn)行該模型。與EC4上的常規(guī)Nvidia G4實(shí)例相比，借助Inferentia，AWS可提供更低的延遲和三倍的吞吐量，且每次推理成本降低40％。

4.昆侖芯片
2019年尾聲，百度宣布首款A(yù)I芯片昆侖已經(jīng)完成研發(fā)，將由三星代工生產(chǎn)。該芯片使用的是三星14nm工藝技術(shù)，封裝解決方案采用的是I－Cube TM。

據(jù)悉，昆侖AI芯片提供512Gbps的內(nèi)存帶寬，在150瓦的功率下實(shí)現(xiàn)260TOPS的處理能力，能支持語(yǔ)音，圖像，NLP等不同的算法模型，其中ERNIE模型的性能是T4GPU的三倍以上，兼容百度飛槳等主流深度學(xué)習(xí)框架。該款芯片主要用于云計(jì)算和邊緣計(jì)算，預(yù)計(jì)在2020年初實(shí)現(xiàn)量產(chǎn)，

5.Nervana NNP 芯片

2019 英特爾人工智能峰會(huì)，英特爾推出面向訓(xùn)練（NNP－T1000）和面向推理（NNP－I1000）的英特爾 Nervana 神經(jīng)網(wǎng)絡(luò)處理器（NNP）。據(jù)了解，Nervana NNP－T 代號(hào) Spring Crest，采用了臺(tái)積電的 16nm FF＋制程工藝，擁有 270 億個(gè)晶體管，硅片面積 680 平方毫米，能夠支持 TensorFlow、PaddlePaddle、PYTORCH 訓(xùn)練框架，也支持 C＋＋深度學(xué)習(xí)軟件庫(kù)和編譯器 nGraph。

Nervana NNP－I，代號(hào)為 Spring Hill，是一款專門用于大型數(shù)據(jù)中心的推理芯片。這款芯片是基于 10nm 技術(shù)和 Ice Lake 內(nèi)核打造的，打造地點(diǎn)是以色列的 Haifa ，Intel 號(hào)稱它能夠利用最小的能量來(lái)處理高負(fù)載的工作，它在 ResNet50 的效率可達(dá) 4．8TOPs／W，功率范圍在 10W 到 50W 之間。

6.Orin芯片

2019年NVIDIA GTC中國(guó)大會(huì)中英偉達(dá)發(fā)布了全新的軟件定義自動(dòng)駕駛平臺(tái)——NVIDIA DRIVE AGX Orin，該平臺(tái)內(nèi)置全新Orin系統(tǒng)級(jí)芯片，由170億個(gè)晶體管組成。

Orin系統(tǒng)級(jí)芯片集成了NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器，每秒可運(yùn)行200萬(wàn)億次計(jì)算，幾乎是NVIDIA上一代Xavier系統(tǒng)級(jí)芯片性能的7倍。此外，Orin可處理在自動(dòng)駕駛汽車和機(jī)器人中同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò)，并且達(dá)到了ISO 26262 ASIL－D等系統(tǒng)安全標(biāo)準(zhǔn)。

7.邃思DTU

由騰訊領(lǐng)投、融資累計(jì)超過(guò) 6 億元的 AI 芯片公司燧原科技，在2019年發(fā)布會(huì)中推出自主研發(fā)的首款 AI 訓(xùn)練芯片“邃思 DTU”。

據(jù)了解邃思DTU采用格羅方德12nm FinFET工藝，480平方毫米主芯片上承載141億個(gè)晶體管，實(shí)現(xiàn)2．5D高級(jí)立體封裝，據(jù)稱單卡單精度算力為業(yè)界第一，達(dá)20TFLOPS，首次支持混合精度，半精度及混合精度下算力達(dá)80TFLOPS，最大功耗僅225W。

邃思芯片基于可重構(gòu)芯片的設(shè)計(jì)理念，其計(jì)算核心包含 32 個(gè)通用可擴(kuò)展神經(jīng)元處理器（SIP），每 8 個(gè) SIP 組合成 4 個(gè)可擴(kuò)展智能計(jì)算群（SIC）。SIC 之間通過(guò) HBM 實(shí)現(xiàn)高速互聯(lián)，通過(guò)片上調(diào)度算法，數(shù)據(jù)在遷移中完成計(jì)算，實(shí)現(xiàn)了 SIP 利用率最大化。

8.思元220芯片

寒武紀(jì)在第21屆高交會(huì)正式發(fā)布邊緣AI系列產(chǎn)品思元220（MLU220）芯片及M．2加速卡產(chǎn)品，標(biāo)志寒武紀(jì)在云、邊、端實(shí)現(xiàn)了全方位、立體式的覆蓋。

思元220芯片采用了寒武紀(jì)在處理器架構(gòu)領(lǐng)域的一系列創(chuàng)新性技術(shù)，其架構(gòu)為寒武紀(jì)最新一代智能處理器MLUv02，實(shí)現(xiàn)最大32TOPS（INT4）算力，而功耗僅10W，可提供16／8／4位可配置的定點(diǎn)運(yùn)算。作為通用處理器，支持各類深度學(xué)習(xí)技術(shù)，支持多模態(tài)智能處理（視覺(jué)、語(yǔ)音和自然語(yǔ)言處理），應(yīng)用領(lǐng)域廣泛，客戶可以根據(jù)實(shí)際應(yīng)用靈活的選擇運(yùn)算類型來(lái)獲得卓越的人工智能推理性能。

9.昇騰910

2019年8月，華為在深圳總部發(fā)布AI處理器Ascend 910（昇騰910），據(jù)華為發(fā)布的參數(shù)顯示，昇騰910是一款具有超高算力的AI處理器，其最大功耗為310W，華為自研的達(dá)芬奇架構(gòu)大大提升了其能效比。八位整數(shù)精度（INT8）下的性能達(dá)到512TOPS，16位浮點(diǎn)數(shù)（FP16）下的性能達(dá)到256 TFLOPS。

作為一款高集成度的片上系統(tǒng)（SoC），除了基于達(dá)芬奇架構(gòu)的AI核外，昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器（Task Scheduler），因而具有自我管理能力，可以充分發(fā)揮其高算力的優(yōu)勢(shì)。

昇騰910集成了HCCS、PCIe 4．0和RoCE v2接口，為構(gòu)建橫向擴(kuò)展（Scale Out）和縱向擴(kuò)展（Scale Up）系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口，片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4．0的吞吐量比上一代提升一倍。

10.征程二代

2019世界人工智能大會(huì)中，人工智能芯片初創(chuàng)公司地平線正式宣布量產(chǎn)中國(guó)首款車規(guī)級(jí)人工智能芯片——征程二代，并且獲得五個(gè)國(guó)家市場(chǎng)客戶的前裝定點(diǎn)項(xiàng)目。

據(jù)介紹，征程二代于今年初流片成功，搭載地平線自主創(chuàng)新研發(fā)的高性能計(jì)算架構(gòu)BPU2．0（Brain Processing Unit），可提供超過(guò)4TOPS的等效算力，典型功耗僅2瓦，滿足AEC－Q100標(biāo)準(zhǔn)，算力利用率超過(guò)90％，每TOPS算力可以處理的幀數(shù)可達(dá)同等算力GPU的10倍以上，識(shí)別精度超過(guò)99％，延遲少于100毫秒，多任務(wù)模式下可以同時(shí)跑超過(guò)60個(gè)分類任務(wù)，每秒鐘識(shí)別目標(biāo)數(shù)可以超過(guò)2000個(gè)。

此次地平線率先推出首款車規(guī)級(jí)AI芯片不僅實(shí)現(xiàn)了中國(guó)車規(guī)級(jí)AI芯片量產(chǎn)零的突破，也補(bǔ)齊了國(guó)內(nèi)自動(dòng)駕駛產(chǎn)業(yè)生態(tài)建設(shè)的關(guān)鍵環(huán)節(jié)。

小結(jié)

目前通過(guò)CPU／GPU處理人工神經(jīng)網(wǎng)絡(luò)效率低下，谷歌大腦需要1．6萬(wàn)個(gè)CPU核跑數(shù)天方能完成貓臉識(shí)別訓(xùn)練；AIpha GO與李世石下棋時(shí)用了1000個(gè)CPU和200個(gè)GPU，AI芯片的發(fā)展是第三次AI浪潮中極為明顯的趨勢(shì)，算法已滲透到云服務(wù)器和智能手機(jī)的方方面面，未來(lái)每臺(tái)計(jì)算機(jī)可能都需要一個(gè)專門的深度學(xué)習(xí)處理器。