• <code id="ibq7m"><label id="ibq7m"><video id="ibq7m"></video></label></code>
        1. <var id="ibq7m"><label id="ibq7m"><ol id="ibq7m"></ol></label></var>
          1. <code id="ibq7m"></code><var id="ibq7m"><output id="ibq7m"></output></var>
              <table id="ibq7m"><dd id="ibq7m"></dd></table><table id="ibq7m"></table>
              <var id="ibq7m"></var>
              1. <code id="ibq7m"></code>

                <var id="ibq7m"><label id="ibq7m"><ol id="ibq7m"></ol></label></var>

                400萬+工程師在用

                400萬+工程師在用

                國產高性能GPGPU的破局點是什么?

                今日頭條

                309人已加入

                描述

                GPU誕生的原因是人們需要更好地處理3D游戲中的圖形渲染,因此GPU擁有很多很小的內核增加并行處理能力,然后通過圖形流水線的模式做圖形處理。由于天生核心數量多,因此GPU計算能力增加迅速,業界普遍認為2004年前后GPU計算能力已經超過CPU,此后兩者之間的算力差距越拉越大。
                ?
                擁有強大算力之后,更多的應用開始找上GPU,比如氣候檢測,還有時下大熱的深度學習等??焖僭鲩L的計算需求也開始改變GPU,早期用于通用計算的GPU實際上還是遵循圖形處理的原則來設計,內部依然有Vertex級處理器以及Fragment級處理器,面向其他運算需求顯得“不倫不類”,直到英偉達設計出了統一處理器。
                ?
                此后,GPGPU在任務清晰且計算量要求大的領域,比如矩陣的計算上優勢愈發凸顯。受益于人工智能、大數據和萬物互聯等多層buff加持,越來越多的行業開始提出這樣的計算需求,GPGPU前景光明且市場巨大。在這樣的背景下,目前國內已經涌現出一批GPGPU企業,沐曦集成電路(上海)有限公司(以下簡稱:沐曦)便是其中之一,該公司致力于提供高性能GPU。
                ?

                軟件棧決定了用戶群大小和用戶體驗

                回顧GPGPU的發展,我們發現市場需求不僅是改變了GPGPU的核心布局,同時為了兼顧通用性,軟件端也發展了巨大的改變,從OpenGL演化出統一計算架構CUDA。沐曦光啟智能研究院科學家李兆石在接受電子發燒友采訪時表示,“GPGPU作為一款通用芯片,在面對不同客戶層出不窮的新需求時,需要保證它的可編程性??删幊绦允怯赏晟频能浖肀WC的。對于所有GPGPU來說,軟件棧的規劃直接決定了GPGPU用戶受眾群體大小和用戶使用體驗。因此所有的GPGPU,不論是否國產,都會擁有自己的運算平臺,即軟件棧。比如AMD面向它的MI系列GPGPU,對標CUDA,開發了RoCM,并在RoCM之上移植了PyTorch等AI軟件框架?!?br /> ?
                ?
                沐曦光啟智能研究院科學家李兆石
                ?
                他強調GPGPU上軟件棧是至關重要的,對此他通過分析英偉達的CUDA來解釋原因?!癎PGPU芯片非常龐大,最新的Nvidia A100上有542億個晶體管,它們構成了6912個并發執行的CUDA內核,以及為了保證CUDA內核的數據供給而設計的一套復雜的存儲子系統??紤]到人的思維方式是串行的,用戶很難處理這么多的并發執行單元,因此這么多并發的硬件資源不可能直接暴露給用戶。所以我們需要有一套軟件棧將底層硬件架構的特征抽象成易于理解的編程模型提供給用戶,從而讓用戶充分開發GPGPU的潛力?!?李兆石講到,“然而抽象是有代價的:抽象掩藏掉的硬件細節越多,編程模型對用戶越友好,那么它會越難充分發揮硬件的全部潛力。因此GPGPU的抽象是分層次的:越靠近用戶的層次越易用,同時該層次的性能或者靈活性會越差。這樣特定應用領域的用戶,如果重心在開發效率,可以選擇高層次的編程模型;而需要榨取GPGPU性能潛力的用戶可以選擇低層次的編程模型。這也正是我們把GPGPU的編程模型稱為‘軟件?!脑??!?br /> ?
                目前,國產GPGPU顯然還是跟隨者的狀態,雖然廠商在積極地推進架構創新和軟件創新,但和英偉達之間的差距還是巨大的,因此從英偉達身上國產GPU還有很多經驗可以汲取。李兆石對英偉達在GPGPU上面的軟件實力有著清晰的認識,他指出:“英偉達的AI軟件棧自底向上至少可以分成5層:SASS是硬件實際執行的指令集,類似CPU的匯編;PTX是虛擬指令集,為不同代的Nvidia GPGPU提供了一個統一的編程接口;CUDA是用戶在編寫高性能GPGPU程序時最主要的編程模型;cuBLAS, cuDNN, cuFFT, CUTLASS等運算庫則讓用戶可以通過調用Nvidia針對自家GPGPU高度定制的算子庫,不需要花費太多精力進行性能調優就可以享受到Nvidia GPGPU最好的性能,但它們靈活性受限;TensorRT, Triton, Megastron則是Nvidia針對特定AI應用場景深度定制,讓AI類用戶開箱即用的軟件平臺?!?br /> ?
                可以看出,CUDA處于中間層。CUDA提供了硬件的直接訪問接口,而不必像傳統方式一樣必須依賴圖形API接口來實現GPU的訪問。CUDA采用C語言作為編程語言提供大量的高性能計算指令開發能力,使開發者能夠在GPU的強大計算能力的基礎上建立起一種效率更高的密集數據計算解決方案。
                ?
                李兆石認為:“對于新興的國產GPGPU而言,構建自己的軟件棧時,首要任務是先打好基礎,對標CUDA及以下的抽象層次,充分發揮自己芯片的特色,開發出一套用戶可用、易用的編程模型,正所謂‘不積硅步無以至千里’。然后再結合目標客戶的需求,對標TensorRT等框架,定制開箱即用的高層次編程模型?!?br /> ?
                在此,他談到了沐曦的規劃。當前,沐曦GPGPU的芯片架構和軟件棧是同時開發的。芯片架構上與現有GPGPU擁有不同的新特性,在設計之初都充分考慮了如何在各個層次的編程模型中進行抽象。這樣,沐曦可以保證用戶即可以平滑地從現有GPGPU遷移到沐曦的GPGPU上,又能在使用沐曦的軟件棧時充分享受到新特性帶來的更好體驗。
                ?
                著眼于未來的發展,英偉達CUDA既是國產GPGPU在并行計算架構方面的老師,也是最大的勁敵。目前,CUDA已經能夠支持DX12這樣的API,也支持C語言、Fortran、OpenCL等計算語言,其生態屬性非常強大。并且根據英偉達官方的說法,CUDA未來的發展是開放性的技術平臺,支持更多的并行計算需求。這樣的CUDA會給國產GPGPU在軟件棧方面的發展造成巨大的困擾,因此李兆石呼吁:“國內各家GPGPU創業公司都有自研IP和軟件棧的規劃。從公開的信息來看,各家公司的軟件棧規劃都存在一定的共性。希望未來大家可以多多相互交流,共同進步?!?br /> ?

                傳統GPU的軟件棧很難遷移到GPGPU

                GPGPU在GPU的基礎上進行了優化設計,使之更適合高性能并行計算,并能使用更高級別的編程語言,在性能、易用性和通用性上更加強大。相較而言,國產GPU的啟動比國產GPGPU要提前一些,是否有經驗可循呢?
                ?
                李兆石認為:“傳統GPU主要面向圖形渲染類應用。對于Nvidia來說,圖形渲染類應用的軟件棧與GPGPU的軟件棧,只有底層的SASS, PTX和少量CUDA是共享的。再往上走的圖形渲染API層,如OpenGL, Vulkan等,目前GPGPU還不需要支持。國產傳統的圖形渲染GPU,大多基于自研的匯編層,對提供圖形渲染API層提供支持。我們的底層設計(與Nvidia SASS和PTX同層次的匯編)與Nvidia及其它國產GPU是不同的,因此傳統的圖形渲染GPU軟件棧難以直接遷移到GPGPU上?!?br /> ?
                應用領域方面,GPGPU將應用擴展到了圖形之外,在科學計算、區塊鏈、大數據處理、工程計算、金融、基因等方面都有重要的應用,但更多是以服務器的形態提供高算力。在應用層面,目前傳統GPU和CPU的融合趨勢已經顯現,比如AMD APU系列,蘋果的M1芯片、以及大多數手機SoC芯片等,它們的CPU和GPU都是直接在物理上共享內存。這些芯片通過CPU和GPU的緊密耦合,避免了CPU和GPU之間數據跨芯片搬運的能量消耗。
                ?
                李兆石表示:“對于GPGPU而言,目前市面上還沒有成熟的產品,讓CPU和GPGPU在同一個die上緊密耦合。造成這一現象的原因有兩個。首先,CPU和GPGPU之間的通信延遲或帶寬,在目前流行的GPGPU應用中不是系統的瓶頸。GPGPU的編程模型中,CPU與GPGPU間的通信用于處理應用中的控制邏輯。而GPGPU通常用來處理計算密集型應用或者訪存密集型應用,其瓶頸在于GPGPU上的計算資源、或者GPGPU與顯存(GDDR或者HBM)之間的通信帶寬??刂泼芗蛻煤苌俅笠幠2渴鹪贕PGPU上。其次,GPGPU通常以加速卡的形式部署在服務器上,服務器廠商出于成本、可靠性和可擴展性的考慮,會分別采購CPU和GPGPU?!?br /> ?
                “不過,對于CPU和GPGPU的融合,我們還是要以發展的眼光看問題。從應用需求的角度,隨著張量加速單元和HBM技術在GPGPU的普及,GPGPU的計算和訪存能力快速提升。正所謂‘按下葫蘆浮起瓢’,此時CPU和GPGPU的通信代價正在變得越來越顯著。尤其當我們考慮到新興的Pytorch等AI框架的動態圖特性會引入非常頻繁的CPU-GPGPU之間的交互時,低延遲的CPU-GPGPU緊耦合架構就變得更有價值了。從系統設計的角度,新興的Chiplet技術可以有效降低封裝內CPU和GPGPU緊耦合的設計成本。所以我們也很期待新的應用需求和封裝技術可以使能未來的融合CPU-GPGPU芯片?!?李兆石在采訪中講到。

                打開APP閱讀更多精彩內容
                聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯系本站作侵刪。 侵權投訴

                電子發燒友網

                收聽電子行業動態,搶先知曉半導體行業

                全部0條評論

                快來發表一下你的評論吧 !

                最近更新中文字幕第1电影,成长AV片在线观看网站,中文无码不卡人妻在线看,最近中文字幕完整免费,狠狠躁天天躁无码中文字幕 国产高清不卡无码视频| 午夜福利2020国产最新在线观看| 成片一卡一卡二卡手机| 9420免费观看在线大全| 男女肉粗暴进来动态图| 惩罚她用下面夹毛笔写字| 午夜dj在线观看免费完整高清电影视频| 孕妇孕交BBW| 18禁真人无遮挡在线观看| 波多野吉衣| 香港a片| 欧美人与动交视频播放| A级毛片无码免费真人| 一本大道一卡2卡三卡四卡| 1313午夜精品理论片| 在线看撕开奶罩揉吮奶头视频| 免费观看又污又黄在线观看| 丰满年轻岳欲乱中文字幕| 玩弄寂寞难耐邻居少妇| 婷婷五月综合丁香在线| 久久综合日本久久综合88| CHINESE中国女人内谢| 播放少妇的奶头出奶水的毛片| 亚洲日韩色欧另类欧美| 美国人VIDEOS VIDEO8TV| 当着别人面玩弄人妻| 亚洲欧美丝袜 动漫专区| 亚洲精品久久久久中文字幕一区| 欧美曰本—本道免费无码DVD| 一品道门在线播放| 漂亮人妻当面被朋友玩弄| 国色天香社区视频观看| 少妇无码一晚三次| 性色欲情网站| 公车上太深了啊高潮| 日韩人妻无码精品专区综合网| 小草社区观看免费观看| 亚洲丁香五月天缴情综合| 欧美18VIDEOSEX性欧美黑吊| 最新一卡二卡三卡四卡| 波多野结系列加勒比无码| 亚洲性爱网| 欧美熟妇乱子伦XX视频| 人与禽交ZOZO| A片毛片视频免费香港| 黑人玩弄出轨人妻中文字幕| 亚洲最新一卡二卡三卡四卡| 99久久亚洲综合精品| 大伊香蕉精品视频在线| 手机国产丰满乱子伦免费视频| 免费AV网站| 玩中年熟妇让你爽视频| 无码男男作爱A片在线观看| 啦啦啦啦啦啦啦免费视频播放在线观看| 人妻AV无码中文专区久久| 放荡的美妇欧美在线播放| 五月八月完整版在线观看| 一本无码AV中文出轨人妻| 18禁真人无遮挡在线观看| 野花社区在线观看视频在线高清| 东北普通话刺激对白国语高清| BT天堂在线WWW最新版资源| 国产裸体美女视频全黄学生| 国色天香社区高清免费| 欲求不满的寂寞人妻中文字幕| 欲帝精品福利视频导航| 富婆偷人对白在线观看| 丰满少妇高潮惨叫视频| 亚洲国产精品高清线久久| 老熟女激烈的高潮| 成年片黄网站色大全免费西瓜| 一卡二卡三卡四卡每日更新在线观看| 国产在线精品一区二区不卡 | 芒果视频一区二区三区四区| 国模安雅宾馆私拍鲜嫩玉门| 抖音短视频高清在线观看| 色婷婷五月| 八戒八戒在线观看免费播放| 亚洲国产在线精品一区在线观看| 欧美 国产 日韩 另类 视频区| 日本AV不卡在线观看播放| 免费的裸身直播在线观看| 日韩AV在线观看无码免费| 香港三日本三级少妇三级孕妇| 国产美女露脸口爆吞精| 亚洲图综合专区20P| 成年xx视频免费软件| 又色又爽又黄的视频网站| 阿玖在线观看免费| 五月激激激综合网色播| 久久九九有精品国产| 国产精品嫩草影院入口一二三| 白胖年轻妇女BBW| 无限资源2018第1页在线观看| 狂宴群交换伴侣| 苍井空被躁50分钟视频| 狠狠久久噜噜localhost| 18禁止观看美女脱裤子男生桶| 日本一卡二卡三卡四卡手机免费| 免费特级婬片日本高清视频| 色偷拍自怕亚洲综合| 人妻制服丝袜无码中文字幕| AV无码免费岛国动作片片段欣赏网 | 成长AV片在线观看网站| GAV男同AV无码久久| 脱女学小内内摸出水网站| 中国CHINESE老熟女| YY6080亚洲久久无码| 国产性天天综合网| 漂亮被强奷完整版BD漂亮| 女厕蹲下个个Β嘘嘘嘘| 久久E热在这里只有精品99| 国产-第1页-草草影院CCYY| 日本R级在线播放中文在线| 午夜d在线观看免费完整版| 乱子伦XXXX LOCALHOST| 女人高潮抽搐潮喷视频忘忧草| 日本插曲的痛30分钟| 老司机深夜福利我爱AV| 国产丝袜在线精品丝袜不卡| 日韩高清一卡二卡三卡四卡视频| 两熟妇玩双飞真舒服| 中国BBW老头嫖妓女| 日本韩国高清大片| 日本按摩高潮A级中文片| 女人偷拍69XXXXXWWW免费视频| 最新在线伦费观看中文| 亚洲一日韩欧美中文字幕在线| 男的把J伸进女人视频免费| 亚洲欧美国产精品久久| 最近的2019中文字幕国语| 无翼乌全彩无遮挡漫画大全| 国产专区免费资源网站 | 永久免费观看黄网视频| 欧美大色大AV高清| 国产私拍大尺度在线视频| 18禁止观看强奷视6美女裸体频| 2012国语在线看免费观看直播| 亚洲 欧美 日韩 国产 制服| 88亚洲精品综合欧美一区二区三区| 亚洲欧美日韩综合一区在线观看| 欧美在线精彩视频免费播放| 被夫の上司に犯 在线观看| 久久精品国产精品亚洲艾草网| 40熟妇日本JAPANESE| 6一12泑女国外连接| 青草草97超级碰碰碰| 亚洲欧洲国产成人综合| 国产AV一区二区三区无码| 特级无码毛片免费视频| 99久久婷婷国产综合精品青草| 婬荡的寡妇在线播放| 亚洲人成在线观看| 成片一卡二卡三卡动态图片| 老师与学生XXXX中国| VIDEOS亚洲与黑人| 天堂中文在线| 国产尤物亚洲精品不卡| 精品熟女少妇AⅤ免费久久| 99RE66在线观看精品免费| CAOPORM碰视频公开视频| 做一次喷了六次水18P| 欧美天天看A片在线观看| 私密按摩师中文在线观看|