GPU成本高企、顯存墻難破,國產(chǎn)存儲(chǔ)如何推動(dòng)AI普惠化進(jìn)程?

作者 | 發(fā)布日期 2025 年 10 月 21 日 13:56 | 分類 企業(yè)

當(dāng)前,AI應(yīng)用市場的爆發(fā)式增長正在催生對高性能存儲(chǔ)的巨大需求,但高昂的GPU采購成本和難以逾越的“顯存墻”,卻使許多渴望創(chuàng)新的企業(yè)望而卻步。面對這種結(jié)構(gòu)性挑戰(zhàn)與增長機(jī)遇并存的產(chǎn)業(yè)現(xiàn)狀,國產(chǎn)存儲(chǔ)新勢力如何憑借新的系統(tǒng)級思維破局?

為了探尋“從存儲(chǔ)入手實(shí)現(xiàn)AI項(xiàng)目降本增效”的創(chuàng)新路徑,我們與銓興科技eSSD產(chǎn)品線副總經(jīng)理邱創(chuàng)隆和AI產(chǎn)品總監(jiān)王瑜琨進(jìn)行了深度對話,共同解碼AI時(shí)代下存儲(chǔ)的系統(tǒng)級創(chuàng)新與成本致勝的底層邏輯。

重塑價(jià)值:存儲(chǔ)成為TCO和效率的核心驅(qū)動(dòng)力

在AI的浪潮下,存儲(chǔ)的價(jià)值被徹底顛覆。銓興科技eSSD產(chǎn)品線副總經(jīng)理邱創(chuàng)隆指出,過去存儲(chǔ)像是一個(gè)IT系統(tǒng)里的“倉庫”,是配角。然而,隨著AI訓(xùn)練和推理負(fù)載的加重,存儲(chǔ)不再僅僅是數(shù)據(jù)容器,它已成為提升AI系統(tǒng)效率、降低總體擁有成本(TCO)的關(guān)鍵戰(zhàn)略環(huán)節(jié)。

銓興科技eSSD產(chǎn)品線副總經(jīng)理邱創(chuàng)隆

邱創(chuàng)隆進(jìn)一步闡明,AI時(shí)代存儲(chǔ)模組廠商主要扮演著“承上啟下”的關(guān)鍵作用。這要求企業(yè)必須洞察AI數(shù)據(jù)流五個(gè)階段(數(shù)據(jù)讀取、數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型推理、數(shù)據(jù)歸檔)的差異化需求,將主控和閃存芯片進(jìn)行深度調(diào)優(yōu)和驗(yàn)證,確保企業(yè)提供給客戶的是符合未來應(yīng)用趨勢的解決方案。

AI工作流正在驅(qū)動(dòng)存儲(chǔ)產(chǎn)品走向進(jìn)一步分化。邱創(chuàng)隆表示,單一的存儲(chǔ)方案已無法實(shí)現(xiàn)最優(yōu)的成本效益,因此銓興科技提供了層次清晰、精準(zhǔn)匹配應(yīng)用場景的eSSD產(chǎn)品矩陣,為不同需求的企業(yè)提供“速度階梯”。

在AI推理(Inference)和檢索增強(qiáng)生成(RAG)的應(yīng)用階段,負(fù)載特性顯著轉(zhuǎn)向“讀取密集型”,對容量和總體擁有成本(TCO)的要求達(dá)到極致。為此,銓興科技推出了高密度的 PCIe 5.0 QLC eSSD系列,其容量高達(dá)122.88TB,并具備14,000MB/s 的頂級順序讀取速度。這款百TB級容量產(chǎn)品,相較傳統(tǒng)硬盤能帶來6倍的容量提升,不僅能顯著節(jié)省機(jī)柜空間和電力消耗,更從根本上優(yōu)化了AI應(yīng)用長期運(yùn)行的TCO。

而針對AI訓(xùn)練和HPC負(fù)載要求嚴(yán)苛的“混合讀寫”性能和高可靠性需求,銓興則提供了旗艦級的 PCIe 5.0 TLC eSSD系列。該系列具備超14GB/s的連續(xù)讀速和高達(dá)3300K的隨機(jī)IOPS,提供極致的性能保障。同時(shí),該產(chǎn)品還創(chuàng)新性地配備了Dual Port(雙端口)設(shè)計(jì),能為長時(shí)間、不間斷的AI訓(xùn)練任務(wù)提供企業(yè)級的可靠性與高可用性保障。

系統(tǒng)革命:“以存強(qiáng)算”,突破GPU顯存墻

盡管通過eSSD產(chǎn)品矩陣解決了AI數(shù)據(jù)流在容量和速度上的分化需求,但對于大模型部署而言,顯存墻仍是AI普惠化最難逾越的障礙。

銓興科技AI產(chǎn)品總監(jiān)王瑜琨指出,AI模型參數(shù)的增長速度已遠(yuǎn)遠(yuǎn)甩開頂級顯卡顯存的線性擴(kuò)容,形成了難以跨越的結(jié)構(gòu)性鴻溝。他援引數(shù)據(jù)強(qiáng)調(diào):過去幾年模型規(guī)模暴漲了約10倍,而顯存容量僅微增2到3倍。鑒于模型規(guī)模在未來只會(huì)繼續(xù)指數(shù)級攀升,對顯存的爆炸式需求,使得傳統(tǒng)“算力派”直觀堆疊天價(jià)顯卡的策略,不僅帶來了巨額的硬件采購成本,也注定無法長久支持行業(yè)未來AI普惠化的目標(biāo)。

銓興科技AI產(chǎn)品總監(jiān)王瑜琨

因此,銓興科技則選擇了更具戰(zhàn)略價(jià)值的“系統(tǒng)派的折疊梯”戰(zhàn)略,推出了“添翼AI 超顯存融合解決方案”。王瑜琨進(jìn)一步表明,該方案的核心在于“以存強(qiáng)算”的軟硬一體架構(gòu),這一架構(gòu)由兩大部分緊密耦合而成。

硬件基礎(chǔ)是一塊專為AI負(fù)載設(shè)計(jì)的“添翼AI擴(kuò)容卡”。它本質(zhì)上是給GPU加裝了一個(gè)超高速、高壽命的“外掛”緩存,將單卡的等效顯存容量有效擴(kuò)展了 20倍,從而解決了傳統(tǒng)閃存的壽命瓶頸。

軟件核心則是“AI Link算法平臺”。該平臺通過高度并行化的冷熱存儲(chǔ)智能調(diào)度,能夠自主判斷下一步運(yùn)算所需數(shù)據(jù),提前將存儲(chǔ)在擴(kuò)容卡中的“冷數(shù)據(jù)”高效搬運(yùn)到GPU的“熱環(huán)境”中,最終突破了帶寬墻的限制 。

這種系統(tǒng)級的架構(gòu)重構(gòu)帶來了驚人的效益。王瑜琨透露,以訓(xùn)練 671B參數(shù)大模型為例,原先需要 168張頂級顯卡(部署成本大于4200萬元)的任務(wù),如今僅需16張中階顯卡+ 8張?zhí)硪頂U(kuò)容卡(造價(jià)不到200萬元)即可勝任。這使得企業(yè)的訓(xùn)練成本可銳減約95%,同時(shí)模型推理的并發(fā)性能還能獲得高達(dá)50% 的提升,實(shí)現(xiàn)了成本與效率的雙重突破。

王瑜琨明確指出,面對顯存的結(jié)構(gòu)性挑戰(zhàn),行業(yè)必須采納更為高效的折中方案。他強(qiáng)調(diào),將更大規(guī)模的模型參數(shù)遷移至Flash閃存上,是推動(dòng)AI普惠化進(jìn)程、實(shí)現(xiàn)成本效益的未來必然趨勢。

國產(chǎn)AI的底氣:從顯存突破到全體系兼容性

為了將技術(shù)轉(zhuǎn)化為生產(chǎn)力,銓興推出了覆蓋全場景的“Super AI”訓(xùn)推一體機(jī)系列(涵蓋PC、工作站和服務(wù)器),旨在將AI普惠化下沉到中小企業(yè)、研究機(jī)構(gòu)乃至個(gè)人。憑借顯著的成本優(yōu)勢,“添翼AI”解決方案已經(jīng)在高校教學(xué)、政務(wù)、法律等垂直行業(yè)實(shí)現(xiàn)了成功落地。

與此同時(shí),銓興始終將多平臺兼容性作為產(chǎn)品的基礎(chǔ)。其eSSD產(chǎn)品矩陣的廣泛適用性已通過了包括飛騰(Phytium)、龍芯(Loongson)、海光(Hygon)、兆芯在內(nèi)的多家國產(chǎn)CPU平臺和聯(lián)想、新華三、寧暢、超云、長城、金舟遠(yuǎn)航等服務(wù)器平臺的驗(yàn)證,以及中泰證券、北京郵電大學(xué)等行業(yè)客戶的嚴(yán)格驗(yàn)證。這確保了無論是基礎(chǔ)存儲(chǔ)還是AI加速方案,都能在主流計(jì)算環(huán)境中穩(wěn)定運(yùn)行,為“Super AI”系列方案的推廣奠定了堅(jiān)實(shí)的基礎(chǔ)。

對于行業(yè)未來,銓興科技采取了eSSD產(chǎn)品矩陣持續(xù)升級和存算深度耦合技術(shù)集成兩條清晰的迭代路線。

邱創(chuàng)隆副總經(jīng)理披露了銓興科技在存儲(chǔ)產(chǎn)品升級方面的路線圖。他預(yù)計(jì),存儲(chǔ)產(chǎn)業(yè)明年 PCIe 5.0 將取代4.0成為市場主流。在此背景下,銓興科技計(jì)劃在明年下半年推出下一代速度更快的 PCIe 6.0接口產(chǎn)品,以持續(xù)鞏固其在高性能存儲(chǔ)市場的地位。

針對AI存算融合的長期趨勢,王瑜琨認(rèn)為,“以存強(qiáng)算”將毫無疑問成為AI行業(yè)的主流,并與算力實(shí)現(xiàn)更深層次的集成。他指出,從技術(shù)前景看,未來隨著PCIe 7.0等技術(shù)的逐步落地,閃存的帶寬將更加接近DDR5,而容量卻能達(dá)到數(shù)十倍,這將從根本上為AI普惠化奠定技術(shù)基礎(chǔ)。

基于此,銓興科技制定了清晰的長期目標(biāo):到2026年,實(shí)現(xiàn)將200B規(guī)模的模型部署到一臺PC中,達(dá)成萬元以下的千億模型部署;到2027年,則計(jì)劃將萬億級別的參數(shù)搬到個(gè)人PC中,最終推動(dòng)AI的廣泛普惠。

結(jié)語

隨著AI浪潮深入產(chǎn)業(yè)腹地,基礎(chǔ)設(shè)施的成本與效率已成為決定其應(yīng)用廣度的勝負(fù)手。銓興科技憑借eSSD產(chǎn)品矩陣的持續(xù)升級和“添翼AI超顯存融合解決方案”的系統(tǒng)級創(chuàng)新,成功打通了“算力”與“存儲(chǔ)”之間的結(jié)構(gòu)性瓶點(diǎn)。這不僅為AI大模型部署提供了一條成本銳減90%的新路徑,更將萬億參數(shù)模型由云端拉向了終端,極大地拓寬了AI技術(shù)的應(yīng)用范圍。

放眼業(yè)界,在AI普惠化的時(shí)代背景下,“以存強(qiáng)算”和“軟硬協(xié)同”已成為全球存儲(chǔ)廠商共同發(fā)力的創(chuàng)新賽道。各方正積極探索創(chuàng)新介質(zhì)和深度算法,致力于突破顯存價(jià)格的高墻,推動(dòng)AI應(yīng)用真正普及。

(集邦化合物半導(dǎo)體 竹子 整理)

更多SiC和GaN的市場資訊,請關(guān)注微信公眾賬號:集邦化合物半導(dǎo)體。