證券時報記者 王一鳴
前幾年廣受資本追捧的GPU(圖形處理器)這一硬核賽道正在步入洗牌期,一些原本備受矚目的通用GPU設計企業(yè)先后陷入經營困境。與此同時,有頭部企業(yè)繼續(xù)求新求變,已步入AI(人工智能)核心戰(zhàn)場。
對于行業(yè)現狀,北京社科院研究員王鵬向證券時報記者分析,當前國產GPU產業(yè)處于快速發(fā)展與洗牌并存的階段。一方面,隨著AI大模型的需求激增,國產GPU市場迅速崛起,涌現出如摩爾線程、壁仞科技等一批具有創(chuàng)新能力的企業(yè)。這些企業(yè)在技術研發(fā)、產品創(chuàng)新等方面取得了顯著進展,為國產GPU行業(yè)注入了新的活力。另一方面,市場競爭也日益激烈,部分初創(chuàng)企業(yè)由于資金鏈斷裂、技術瓶頸等問題陷入困境,甚至面臨裁員、訴訟等風險。
“長遠來看,國產GPU行業(yè)仍具有廣闊的發(fā)展前景。這源于人工智能、大數據、云計算等技術的快速發(fā)展,對高性能GPU的需求持續(xù)增長;同時,國家政策對半導體產業(yè)的支持力度不斷加大,為國產GPU行業(yè)提供了良好的發(fā)展環(huán)境。此外,隨著國產芯片公司在生態(tài)構建、技術創(chuàng)新等方面的不斷努力,國產GPU有望逐步縮小與國際領先水平的差距。”王鵬說。
幾家歡喜幾家愁
近日,國產GPU獨角獸壁仞科技一則動態(tài)引起業(yè)內關注。該公司在上海證監(jiān)局辦理IPO輔導備案登記,輔導券商為國泰君安。這是繼今年8月26日燧原科技輔導備案報告公布后,又一家啟動IPO的上海AI芯片企業(yè)。
壁仞科技創(chuàng)立于2019年,致力于研發(fā)原創(chuàng)性的通用計算體系,建立高效的軟硬件平臺,同時在智能計算領域提供一體化的解決方案。截至目前,公司已完成多輪融資,公開融資總額超過50億元,投資方包括啟明創(chuàng)投、IDG資本、中芯聚源、格力創(chuàng)投等。
目前,壁仞科技首款國產高端通用GPU(GPGPU)壁礪系列已量產。在9月舉行的2024全球AI芯片峰會上,壁仞科技還首次公布了其自研的異構GPU協(xié)同訓練方案,該方案突破了大模型異構算力孤島難題,實現了在本土異構多GPU芯片算力訓練技術領域的首次突破。
另一家國內GPU獨角獸企業(yè)也有新動作。今年7月,摩爾線程宣布對其夸娥(KUAE)智算集群解決方案進行重大升級,從當前千卡級別大幅擴展至萬卡規(guī)模。摩爾線程創(chuàng)始人兼CEO張建中表示,在多元趨勢下,萬卡已是AI模型訓練主戰(zhàn)場的標配。
事實上,在國內,萬卡集群建設正高歌猛進。去年7月,華為昇騰AI集群規(guī)模從最初的4000卡集群擴展至16000卡,是國內首個萬卡AI集群。
不過,當前國產GPU產業(yè)的分化亦十分明顯,一些原本備受矚目的企業(yè)接連陷入困境。今年8月底,曾獲得2024年度重慶市“獨角獸企業(yè)”稱號的象帝先被曝約400位員工被裁。公司在回應中坦陳:“發(fā)展面臨一定的市場調整壓力……正在進行組織結構和人員配置的優(yōu)化等……并尋找外部融資機會?!绷硪环矫?,象帝先股東還在起訴其創(chuàng)始人唐志敏,因其未能籌集到承諾的5億元B輪融資。
在象帝先陷入困境之前,同處在GPU賽道的礪算科技也曾預警。至今年8月19日,東芯股份公告擬以不超過2億元收購礪算科技37.88%股份,礪算科技的資金緊張局面方得以緩解。
GPU占AI芯片
八成份額
在中關村物聯網產業(yè)聯盟副秘書長袁帥看來,當前國產GPU行業(yè)處于一個復雜而關鍵的轉型期,短期行業(yè)出現降溫和分化,主要是由于市場競爭加劇、技術門檻提高、資本退潮等因素導致企業(yè)資金壓力增大。在此背景下,部分實力較弱的初創(chuàng)企業(yè)在面對挑戰(zhàn)時往往更加脆弱,而頭部企業(yè)則憑借其技術實力、市場布局和資金優(yōu)勢逐漸嶄露頭角。
按定義和應用看,GPU起初是一種顯示芯片,用于加速計算機上的圖像處理。隨著技術進步和應用范圍的擴大,GPU衍生出了GPGPU,后者是通過利用GPU并行處理能力特別強、計算能效比高的特點,處理更為復雜的計算任務(如AI模型訓練與推理等)。基于此,如今的GPU已被廣泛應用于人工智能、虛擬現實、游戲、科學計算等諸多領域。
IDC數據顯示,預計到2025年,GPU仍將占據全球AI芯片八成市場份額。Gartner此前預測,2023年全球人工智能芯片(包含GPU、TPU等)的市場規(guī)模達到530億美元,并預計在2024年增長至671億美元。到2027年,全球人工智能芯片市場規(guī)模預計達到1194億美元。
從行業(yè)格局來看,作為GPU的發(fā)明者,英偉達占據絕對領先地位。Jon Peddie Research(JPR)數據顯示,2024年第一季度英偉達的全球AIB顯卡(也稱獨立GPU)市場份額飆升至88%,而AMD的市場份額下降至12%。JPR預計,2024年第二季度,AI訓練器GPU的出貨量將繼續(xù)增加,而游戲AIB市場可能持平或走低。在AI芯片主戰(zhàn)場,據TechInsights數據,英偉達2023年的數據中心GPU出貨量約為376萬片,比2022年多出近100萬片,市場占比98%,收入達362億美元。壓倒性擊敗了AMD和英特爾等競爭對手。
微軟公司和Meta等數據中心運營商使用英偉達的芯片來開發(fā)和運行AI模型,巨大的需求使其銷售額和股價飆升。英偉達市值在今年6月曾登頂全球第一,達到3.33萬億美元。最新財報顯示,在英偉達Hopper(GPU構架平臺)、GPU計算和網絡平臺強勁需求的推動下,公司數據中心今年第二季度收入達到262.72億美元。
英偉達達成如今成績憑的是什么?袁帥告訴證券時報記者,這主要源于英偉達在GPU設計、制造工藝以及軟件優(yōu)化等方面具有深厚的技術積累,其產品在性能、功耗比和穩(wěn)定性等方面均處于行業(yè)領先地位。同時,該公司建立了完善的生態(tài)系統(tǒng),包括CUDA平臺、軟件開發(fā)工具包(SDK)以及豐富的第三方應用支持等,為開發(fā)者提供了便捷的開發(fā)環(huán)境和廣泛的應用場景。
“英偉達的芯片產品先進且功能強大,配套軟件生態(tài)完善滲透率高,并且產品迭代進化速度快速,所以市場地位尚難以撼動。”深度科技研究院院長張孝榮認為。
機遇和挑戰(zhàn)并存
國內市場方面,自2019年以來,一批國產GPU初創(chuàng)公司先后成立,其中涌現了壁仞科技、摩爾線程、燧原科技等AI芯片設計獨角獸。同時,還有一批老牌芯片設計公司也入局GPU領域。
這些公司的機會在于美國出口管制背景下的國產替代。2022年10月,美國政府禁止英偉達向中國出口高性能H100、A100芯片。英偉達隨后專門面向中國市場推出了不違反美國出口管制要求的A800和H800芯片,至去年10月,這兩項芯片也被限制。2024年2月,英偉達向中國市場特供的H20芯片接受預訂,但該芯片與H100配置相比,GPU核心數量減少41%,性能降低28%。對此,英偉達2023年11月曾透露,數據中心業(yè)務兩成以上受出口管制影響。
與此同時,國內GPU廠商正迎頭趕上。IDC在2023年中發(fā)布的一項中國AI加速卡(公開市場)出貨量統(tǒng)計顯示,2022年上半年到2023年上半年,中國AI加速卡出貨約109萬張,英偉達市場份額為85%,華為市占率為10%,百度市占率為2%,寒武紀和燧原科技均為1%。
從國內產品成果來看,不僅華為昇騰系列表現突出。2024年5月份,摩爾線程與智譜AI開展了新一輪GPU大模型適配、性能測試。結果表明,在推理方面,摩爾線程自研全功能GPU顯著優(yōu)于基準對比產品RTX 3090和RTX 4090;在訓練方面,摩爾線程夸娥千卡智算集群的訓練精度與A100集群相比,誤差在1%以內,而集群性能擴展系數超過90%,模型算力利用率(MFU)與A100集群相當。
壁仞科技則于2022年8月推出采用7nm制程的GPGPU芯片BR100,該芯片峰值算力達到國際廠商彼時在售旗艦產品3倍以上,創(chuàng)下國內互連帶寬紀錄。
不過,挑戰(zhàn)也隨之而來,一些行業(yè)領先企業(yè)先后被美國政府“盯上”。2022年12月,寒武紀等36家被美國政府列入“實體清單”。2023年10月,壁仞科技、摩爾線程等亦被添加到實體清單中。
這對相關企業(yè)影響幾何?寒武紀在2024年半年報中表示,公司及部分子公司已被列入“實體清單”,將對公司供應鏈的穩(wěn)定造成一定風險。受“實體清單”等供應鏈不利因素影響,公司上半年營收6476.53萬元,較上年同期下降43.42%。
生態(tài)建設待完善
王鵬指出,當前國際政治經濟環(huán)境的變化對GPU行業(yè)產生了一定影響。特別是美國對中國AI產業(yè)的打壓政策限制了國內相關企業(yè)的進口渠道和供應鏈穩(wěn)定性。
袁帥向證券時報記者表示,在面臨外部封鎖前提下,國產GPU廠商要站穩(wěn)腳跟并在高端AI芯片領域爭得一席之地并非易事。在硬件層面,國內芯片代工企業(yè)在高端工藝和產能方面相對不足,難以完全滿足國產GPU設計廠商對高端AI芯片的生產需求;在軟件層面,英偉達等國際巨頭在軟件生態(tài)(CUDA等)和IP授權方面擁有強大優(yōu)勢。國產GPU廠商在構建和完善軟件生態(tài)以及獲取關鍵IP授權領域仍顯薄弱。
事實上,CUDA被業(yè)內普遍認為是英偉達最大護城河。英偉達CEO黃仁勛在今年也曾強調CUDA軟件系統(tǒng)生態(tài)對于AI時代的重要性?!澳壳?,CUDA已實現良性的發(fā)展循環(huán),全球擁有500萬開發(fā)者,覆蓋醫(yī)療保健、金融服務、計算機行業(yè)、汽車行業(yè)等領域。”黃仁勛說。
中國工程院院士,高性能計算研究所所長鄭緯民在今年7月7日的信息化百人會上指出:“這些年國產芯片無論是軟件硬件都有很大的進展,但是用戶不太喜歡用,原因是國產卡的生態(tài)系統(tǒng)不太好。”
鄭緯民認為,這需要做好系統(tǒng)設計和相關軟件優(yōu)化,具體包括十個方面:編程框架、并行加速、通信庫、算子庫、AI編譯器、編程語音、調度器、內存分配系統(tǒng)、容錯系統(tǒng)、存儲系統(tǒng)等。在他看來,在國產算力支撐大模型訓練時,國產AI芯片只能達到國外芯片60%的性能,但如果把前述十個方面的軟件生態(tài)做好了,客戶也會滿意。
國泰君安在今年3月發(fā)布的《重視AI芯片配套的軟件生態(tài)》報告中總結:誰能做出中國版“CUDA”,就能占領AI算力高地。國內各大廠商已在GPU生態(tài)上積極布局,包括驅動程序、開發(fā)工具、應用程序接口(API)等,以確保其產品能夠更好地服務于人工智能、大數據處理、云計算和游戲等多樣化的應用場景。例如,華為推出了CANN以及對應的生態(tài)體系,力求突破技術瓶頸。此外,像景嘉微、摩爾線程等公司也在自主研發(fā)GPU產品,并努力打造與之兼容的軟件環(huán)境,以減少對外部供應商的依賴,提升國產GPU的市場競爭力等。