91精品国产91久无码网站软件,国产成人啪视频一区二区三区,亚洲综合无码一区二区三区

FPGA難以逾越的瓶頸究竟該如何突破

發(fā)布日期： 2019-06-10 瀏覽次數(shù)： 1,172

如今，電子行業(yè)發(fā)展速度令人瞠舌，5G、AI、工業(yè)4.0、智能汽車一波又一波的應(yīng)用革新引領(lǐng)了“新浪潮”，但隨之帶來(lái)的就是巨量的計(jì)算、分析、處理量。數(shù)據(jù)顯示，2019年數(shù)據(jù)總量將達(dá)40ZB總量，如此龐大的潛在計(jì)算量，FPGA的小尺寸、低功耗以及高靈活性等特點(diǎn)恰與新興技術(shù)“不謀而合”。

據(jù)Semico統(tǒng)計(jì)，F(xiàn)PGA市場(chǎng)正在逐年增長(zhǎng)，而復(fù)合年均增長(zhǎng)率高達(dá)38.4%，至2023年將具有55億-60億美元的規(guī)模。Achronix Semiconductor 總裁兼首席執(zhí)行官Robert Blake表示對(duì)于FPGA近年的市場(chǎng)增長(zhǎng)非常興奮，相信在龐大高速增長(zhǎng)的市場(chǎng)中新產(chǎn)品將有出色的表現(xiàn)。

據(jù)統(tǒng)計(jì)，約有25%的企業(yè)選擇入局AI/ML以保持企業(yè)自身的競(jìng)爭(zhēng)力，未來(lái)兩年內(nèi)，將會(huì)有接近四分之三的企業(yè)會(huì)布局AI。而AI方面，算法仍在不斷演進(jìn)，數(shù)值精度選擇越來(lái)越多樣性，但僅依賴數(shù)據(jù)格式的轉(zhuǎn)變降低能耗的方法已接近瓶頸，市場(chǎng)需要更具有高效計(jì)算力、高效大帶寬的數(shù)據(jù)運(yùn)送能力、豐富儲(chǔ)緩存能力的最高能效比的廣適應(yīng)性平臺(tái)。

5月22日，Achronix宣布推出全新的 “FPGA+”系列產(chǎn)品Speedster7t FPGA，該產(chǎn)品采用臺(tái)積電（TSMC）7nm FinFET工藝打造。據(jù)介紹，該產(chǎn)品將FPGA與ASIC技術(shù)融合，兼顧了兩者的優(yōu)點(diǎn)。

除此之外，Speedster7t FPGA具有革命性的新型二維片上網(wǎng)絡(luò)（2D NoC）和一系列針對(duì)高帶寬和人工智能/機(jī)器學(xué)習(xí)（AI / ML）應(yīng)用進(jìn)行了優(yōu)化的新型機(jī)器學(xué)習(xí)處理器（MLP）。另外，值得一提的是，Speedster7t FPGA還具有滿足未來(lái)AI/ML需求所需的超高帶寬接口，包括400G以太網(wǎng)端口、用于數(shù)據(jù)傳輸?shù)腜CI Express Gen5端口以及用于業(yè)界最靈活、低成本、高帶寬存儲(chǔ)的GDDR6控制器。

利用四個(gè)架構(gòu)代系的硬件和軟件開(kāi)發(fā)基礎(chǔ)上的創(chuàng)新和積淀，客戶可以擁有更快的設(shè)計(jì)周期、更好的設(shè)計(jì)表現(xiàn)，另外，還可以降低設(shè)計(jì)中的風(fēng)險(xiǎn)、減少所需設(shè)計(jì)面積。

FPGA難以逾越的瓶頸究竟該如何突破

Blake表示：“我們正處于智能化、自學(xué)習(xí)計(jì)算的高增長(zhǎng)階段的早期，這種計(jì)算將廣泛影響我們?nèi)盏某Ｉ睢?rdquo; Semico Research公司ASIC和SoC首席市場(chǎng)分析師Rich Wawrzyniak表示：“全新的系列產(chǎn)品是創(chuàng)新性芯片架構(gòu)實(shí)現(xiàn)爆發(fā)的一個(gè)卓越案例，創(chuàng)造該架構(gòu)的目的是直接面向AI應(yīng)用處理大量的數(shù)據(jù)。”

如今，為了適應(yīng)當(dāng)前應(yīng)用的高速發(fā)展，大多公司的設(shè)計(jì)團(tuán)隊(duì)開(kāi)始選擇全新的方案。眾所周知，ASIC具有高性能、低功耗的優(yōu)勢(shì)，但相對(duì)來(lái)說(shuō)，其內(nèi)核執(zhí)行外的任何算法都是凍結(jié)的，所以FPGA的高靈活性、高適應(yīng)性相比來(lái)說(shuō)更具優(yōu)勢(shì)。那么，有沒(méi)有一款產(chǎn)品即具有FPGA的適應(yīng)性，也兼顧ASIC的超高表現(xiàn)力？

Speedster7t FPGA系列產(chǎn)品正是將二者相融合，利用臺(tái)積電（TSMC）7nm技術(shù)，構(gòu)建出全新的具有高性能、低功耗、高靈活性、高適應(yīng)性的FPGA+。

假若將400G內(nèi)容傳送到以太網(wǎng)比作在傳送帶上傳送，影響傳輸?shù)某藗魉蛶俣?，還有盒子的大小。傳輸速度需要足夠快確保來(lái)得及裝包，而越大的盒子也會(huì)降低效率。傳統(tǒng)FPGA在傳輸400G內(nèi)容時(shí)，無(wú)論如何調(diào)整傳輸大小和傳輸頻率，也無(wú)法達(dá)到以太網(wǎng)的傳輸曲線。所以對(duì)于傳統(tǒng)FPGA幾乎無(wú)法滿足超高速的傳輸條件。

來(lái)自Speedster7t高速I(mǎi) / O和存儲(chǔ)器端口的數(shù)萬(wàn)兆比特?cái)?shù)據(jù)很容易淹沒(méi)傳統(tǒng)FPGA面向比特位的可編程互連邏輯陣列的路由容量，而Speedster7t架構(gòu)包含一個(gè)可橫跨和垂直跨越FPGA邏輯陣列的創(chuàng)新性的、高帶寬的二維片上網(wǎng)絡(luò)（NOC），它們連接到所有FPGA的高速數(shù)據(jù)和存儲(chǔ)器接口。

它們就像疊加在FPGA互連這個(gè)城市街道系統(tǒng)上的空中高速公路網(wǎng)絡(luò)一樣，Speedster7t的NoC支持片上處理引擎之間所需的高帶寬通信。NoC中的每一行或每一列都可作為兩個(gè)256位實(shí)現(xiàn)，單向的、行業(yè)標(biāo)準(zhǔn)的AXI通道，工作頻率為2Ghz，同時(shí)可為每個(gè)方向提供512 Gbps的數(shù)據(jù)流量。

FPGA難以逾越的瓶頸究竟該如何突破

通過(guò)在Speedster中實(shí)現(xiàn)專用二維 NoC，極大地簡(jiǎn)化了高速數(shù)據(jù)移動(dòng)，并確保數(shù)據(jù)流可以輕松地定向到整個(gè)FPGA結(jié)構(gòu)中的任何自定義處理引擎。最重要的是，NOC消除了傳統(tǒng)FPGA使用可編程路由和邏輯查找表資源在整個(gè)FPGA中移動(dòng)數(shù)據(jù)流中出現(xiàn)的擁塞和性能瓶頸。這種高性能網(wǎng)絡(luò)不僅可以提高Speedster7t FPGA的總帶寬容量，還可以在降低功耗的同時(shí)提高有效LUT容量。

傳統(tǒng)FPGA使用DSP模塊有著相對(duì)有限的表現(xiàn)力，具體表現(xiàn)在不高效的數(shù)值精度支持、需要消耗額外邏輯和Memory資源、性能受限于FPGA布線。

Speedster7t FPGA搭載全新的機(jī)器學(xué)習(xí)處理器（MLP），將計(jì)算、存儲(chǔ)和程序集于一身，使其支持陣列式乘累積計(jì)算架構(gòu)、內(nèi)嵌緩存、可配置以支持演進(jìn)中算法、支持廣泛各種不同整點(diǎn)和浮點(diǎn)格式。大規(guī)模的可編程計(jì)算單元平行陣列是其核心，可提供業(yè)界最高的、基于FPGA的計(jì)算密度，另外，也具有最高的能效比。

MLP是高度可配置的、計(jì)算密集型的單元模塊，可支持4到24位的整點(diǎn)格式和高效的浮點(diǎn)模式，包括對(duì)TensorFlow的16位格式的支持，以及可使每個(gè)MLP的計(jì)算引擎加倍的增壓塊浮點(diǎn)格式的直接支持。

MLP與嵌入式存儲(chǔ)器模塊緊密相鄰，通過(guò)消除傳統(tǒng)設(shè)計(jì)中與FPGA布線相關(guān)的延遲，來(lái)確保以750 MHz的最高性能將數(shù)據(jù)傳送到MLP。這種高密度計(jì)算和高性能數(shù)據(jù)傳輸?shù)慕Y(jié)合使得處理器邏輯陣列能夠提供基于FPGA的最高可用計(jì)算能力以每秒萬(wàn)億次運(yùn)算數(shù)量為單位（TOPS，Tera-Operations Per Second）。

高性能計(jì)算和機(jī)器學(xué)習(xí)系統(tǒng)的關(guān)鍵之處是高片外存儲(chǔ)器帶寬，從而為多個(gè)數(shù)據(jù)流提供存儲(chǔ)源和緩沖。 Speedster7t器件是唯一支持GDDR6存儲(chǔ)器的FPGA，該類存儲(chǔ)器是具有最高帶寬的外部存儲(chǔ)器件。每個(gè)GDDR6存儲(chǔ)控制器都能夠支持512 Gbps的帶寬，Speedster7t器件中有多達(dá)8個(gè)GDDR6控制器，可以支持4 Tbps的GDDR6累加帶寬，并且以很小的成本就可提供與基于HBM的FPGA等效存儲(chǔ)帶寬。

“美光（Micron）樂(lè)于攜手Achronix去實(shí)現(xiàn)全球第一個(gè)面向高帶寬存儲(chǔ)需求而直接加載了GDDR6的FPGA產(chǎn)品，”美光計(jì)算與聯(lián)網(wǎng)業(yè)務(wù)部營(yíng)銷副總裁Mal Humphrey。“像這樣的創(chuàng)新的和可擴(kuò)展的解決方案將推動(dòng)人工智能領(lǐng)域內(nèi)的差異化，其中異構(gòu)計(jì)算可選方案與高性能的存儲(chǔ)是加速獲得數(shù)據(jù)內(nèi)涵的必需部分。”

非凡的存儲(chǔ)帶寬需要好的“后衛(wèi)”才能真正發(fā)揮出其性能。Speedster7t器件包括業(yè)界最高性能的接口端口，以支持極高帶寬的數(shù)據(jù)流。

Speedster7t器件擁有多達(dá)72個(gè)業(yè)界最高性能的SerDes，可以達(dá)到1到112 Gbps的速度。還有帶有前向糾錯(cuò)（FEC）的硬件400G以太網(wǎng)MAC，支持4x 100G和8x 50G的配置，以及每個(gè)控制器有8個(gè)或16個(gè)通道的硬件PCI Express Gen5控制器。

Speedster7t FPGA器件的大小范圍為從363K至2.6M 的6輸入查找表（LUT），無(wú)論是低成本客戶還是高端客戶，均可滿足。而FPGA+如此眾多的優(yōu)點(diǎn)也可“隨意馳騁”在AI、圖像處理、語(yǔ)言處理、Database加速、加密算法、網(wǎng)絡(luò)處理方案上。

FPGA難以逾越的瓶頸究竟該如何突破

據(jù)Achronix表示，支持所有Achronix產(chǎn)品的ACE設(shè)計(jì)工具現(xiàn)已可提供，可支持包括Speedcore eFPGA和SpeedchipFPGA多晶粒封裝芯片（Chiplet）。相關(guān)配套軟件將于第三季度面世，更加高級(jí)的語(yǔ)言讓設(shè)計(jì)開(kāi)發(fā)更具表現(xiàn)力，第一批用于評(píng)估的器件和開(kāi)發(fā)板也將于2019年第四季度提供。

·上一篇: 瑞薩電子發(fā)布RX微控制器系列RX72M產(chǎn)品組
·下一篇: 如何確保LED產(chǎn)品的高品質(zhì)和質(zhì)量

其他關(guān)聯(lián)資訊

木林森林依達(dá)：以最高產(chǎn)品規(guī)格力拼印度照明標(biāo)

2016-04-03

電力拖動(dòng)控制線路圖13例

2018-11-22

光電隔離電路設(shè)計(jì)方案

2018-12-28

塑料門(mén)窗焊接機(jī)典型故障及處理

2018-08-27

如何開(kāi)發(fā)微型太陽(yáng)能無(wú)線傳感器節(jié)點(diǎn)

2018-11-11