在线观看精品视频一区二区三区|97精品在线免费视频观看|亚洲伊人22综合开心网|亚洲欧美综合精品一区

DeepSeek砸開裂縫,國產算力奔涌而出
來源:第一財經作者:彭海斌2025-02-07 15:43
(原標題:DeepSeek砸開裂縫,國產算力奔涌而出 | 萬有AI力)

中國市場會慢慢演變,屆時英偉達會是一部分算力底座,其他國產芯片是另一部分算力底座。

DeepSeek是國產算力企業(yè)在春節(jié)看到的最大煙花。

2025年春節(jié)前,DeepSeek發(fā)布大模型;春節(jié)期間,國內GPU企業(yè)以及云計算廠商等,紛紛披露適配DeepSeek模型的進展。為此,不少科技從業(yè)人員度過了一個無休的假期。DeepSeek大模型的訓練是基于英偉達的GPU,目前后者是全球大模型的算力底座(占比九成以上)。不過,DeepSeek也指向重大轉變的可能:訓練一款性能優(yōu)異的大模型,不需要那么多高的算力投入。

DeepSeek震蕩科技圈,國產算力搭配國產大模型的機會出現(xiàn)。沐曦CTO楊建認為,今年年底部分大模型的預訓練可能會轉入非英偉達的卡,明年這種趨勢會更加明顯。“中國市場會慢慢演變,屆時英偉達會是一部分算力底座,其他國產芯片是另一部分算力底座。全球算力供應變成兩條并行的線路了?!?/p>

國產算力搭配國產模型

春節(jié)前后,國產芯片密集適配DeepSeek。

2月1日,大模型云服務平臺Silicon Cloud上線了DeepSeek-V3、DeepSeek-R1。Silicon Cloud背后的公司硅基流動特別強調,“在自研推理加速引擎加持下,硅基流動團隊基于華為云昇騰云服務部署的DeepSeek 模型可獲得持平全球高端GPU部署模型的效果。”

2月2日,Gitee AI表示在春節(jié)期間上線四個較小尺寸的DeepSeek模型,均部署在國產的沐曦曦云GPU上,面向開發(fā)者市場。

據沐曦CTO楊建向第一財經介紹,從雙方協(xié)商到部署完成,整個過程不過兩天時間?!澳P痛笮Q定了使用場景,比如1.5B模型可以用到手機上,7B及以上模型都可以用在云端或者私有化部署上。”

2月4日,摩爾線程宣布完成了小尺寸的DeepSeek模型在其自主設計的夸娥(KUAE)GPU集群上的部署,并表示即將開放夸娥智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。

“DeepSeek V3和R1模型的部署需要集群能力。但基于DeepSeek蒸餾的小模型,不需要集群也能部署。摩爾線程基于自研全功能GPU,通過開源與自研雙引擎方案,可以快速實現(xiàn)對DeepSeek蒸餾模型的推理服務部署?!蹦柧€程AI與云計算副總裁王華書面回復第一財經時表示。

2月5日,云服務商優(yōu)刻得宣布基于壁仞科技國產芯片的內存架構、多模型適配能力,開展包括R1在內的DeepSeek全系列模型適配工作。壁仞科技是一家中國GPU廠商。實際上,在壁仞科技的芯片上部署DeepSeek之前,優(yōu)刻得已經在英偉達芯片上部署了這款大熱的模型。

“我們應該是在除夕那天完成的部署?!眱?yōu)刻得計算產品中心研發(fā)總監(jiān)王曉慧對第一財經表示,很多科技企業(yè)和技術人員被DeepSeek年前所放的大煙花所震動,度過了一個無休的春節(jié)。

在DeepSeek-V3/R1上線不久,昆侖芯也完成了全版本模型適配,其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小模型。昆侖芯方面表示,該公司的P800僅需32臺即可支持模型全參訓練,完成模型持續(xù)訓練和微調。

這幾家中國芯片企業(yè)表態(tài)前后,國內國際的科技大廠也先后表示已經將DeepSeek模型納入其產業(yè)生態(tài),這些大廠包括了國內的阿里云、百度云以及騰訊云,美國的亞馬遜云科技、Meta、谷歌等。

不過,這些科技大廠的算力底座基本都是英偉達。

“在大模型訓練過程中,我認為全球98%的訓練是基于英偉達GPU算力底座的。今天為止,非英偉達算力底座的訓練合在一起可能也就2%的市場份額?!睏罱ǜ嬖V記者。

王曉慧同樣認為,當下“云上算力的分布,98% 、99%都是英偉達?!?/p>

DeepSeek展示了超強的產業(yè)穿透力,不過它并沒有脫離英偉達生態(tài)。王華認為,DeepSeek繞過英偉達的CUDA是誤讀,本質上其技術實現(xiàn)仍深度依賴NVIDIA生態(tài)的核心組件(PTX)。即使框架層試圖抽象化CUDA API,只要底層運行在英偉達GPU上,就不可避免與CUDA工具鏈和硬件驅動綁定。這種依賴關系反映了當前AI算力領域“NVIDIA主導,開源生態(tài)依附”的現(xiàn)實格局。

“只是第一步跨出來了”

“國產算力把DeepSeek模型跑起來,其實是相對比較容易的?,F(xiàn)在大家都只是第一步跨出來了?!蓖鯐曰郾硎尽?/p>

國產GPU適配主流開源大模型已經有幾年時間,比如支持Meta的LlaMa、阿里的通義千問等。但難點之一在于如何把模型架構跟硬件架構做比較好地結合,使其整體性能得到更大提升。

目前DeepSeek大模型搭配的國產GPU所能展示出來的性能和英偉達GPU還有一定差距。這背后原因在于DeepSeek模型本身的架構,它的訓練、推理過程,最初都是在英偉達芯片上跑出來的,針對英偉達芯片做了高度的調優(yōu)。“短時間內,很難把這些優(yōu)化點匹配到國產芯片上來。我覺得這也是接下來各大國產芯片廠商要去做的一件事情。”

國產芯片繞過英偉達抵達最終用戶,難點更在于英偉達的護城河寬且深。

“比如說他(指用戶)現(xiàn)在跑一個(英偉達)4090或者跑一個(英偉達)H100,裝一個軟件報錯了。他去論壇或者問身邊有經驗的人,就能非常容易地找到解決方案。大家遇到過類似的問題,能夠在社區(qū)里面找到可以咨詢的人?!睏罱▽τ浾哒f,而很多國產卡的信息不那么開放,社區(qū)活躍度沒有那么高,用戶一旦遇到卡點就很難解決,要花很多時間在非業(yè)務上。

這一點在小型團隊上表現(xiàn)得更加明顯。

直播、數(shù)字人等小型團隊,有時候只有四五個人。這些團隊在財力上缺乏騰挪的空間,在技術迭代上缺乏騰挪的時間。“他們做東西一定是一上來就要養(yǎng)活團隊。哪個更容易上手,哪個錢更少,他一定是去走這條路徑,而不是一上來就國產化。”王曉慧說,小型公司部署大模型的時候,優(yōu)先考慮的還是英偉達的算力,這是最快看到結果,或者試錯成本最低的方式。

國產芯片往往需要在價格上給出折扣,才能更好導入私有化部署的企業(yè)。王曉慧認為:“國產算力卡的性價比要達到20%、甚至30%的提升,否則企業(yè)很少有會愿意去做主動替換?!?/p>

美國在過去幾年實施的高端算力芯片禁令,使得中國企業(yè)更難以獲得英偉達產品,而DeepSeek爆火之后,已經有些美國企業(yè)開始炒作進一步限制中國芯片進口。美國禁令倒逼中國芯片企業(yè)發(fā)展。

“DeepSeek火了之后,美國企業(yè)是非??只诺摹K晕磥韺χ袊懔Φ墓芸匾欢〞絹碓絿?。我們自身如果沒有任何突破的話,算力就會成為一個瓶頸。所以國產算力是必然要去走的一條路?!蓖鯐曰壅f。

并行的算力供應線

據楊建觀察,DeepSeek公開的技術報告對芯片設計給出了一些建議。

“它自己在跑H800的過程中,發(fā)現(xiàn)有一些設計本身是不太合理的。比如芯片占用大量的算力去做通信,DeepSeek提出能不能把通信抽出來做。英偉達就很難根據這種建議去做改進,但是國產卡是有可能采納這部分意見的?!睏罱ㄕf。英偉達生態(tài)龐大而牽一發(fā)動全身,國產芯片企業(yè)普遍規(guī)模比較小,也有靈活機動的優(yōu)勢?!皣a芯片起步沒有那么早,技術棧沒有那么深,想要去做一些調整,應該是比較輕量的。”

DeepSeek并不比其他國產大模型更容易搭載國產芯片。但王曉慧也認為,只要是走在這個發(fā)展路徑上,一定會適配的越來越好。

王曉慧表示:“它不可能一下子把所有在英偉達上的優(yōu)化,能夠無縫遷移到國產卡上,這是有適配周期和過程的。但你這有了這樣的一個模型架構,國產卡可以去出一些軟件升級,一些還在萌芽里的芯片廠在設計上可能也會有一些新的想法,能夠去讓DeepSeek優(yōu)化的更好?!?/p>

騰訊云、優(yōu)刻得這樣的平臺搭載的大模型接近百款,除了使用英偉達的芯片之外,在幾年前就已經適配壁仞科技等國產芯片。

最早的時候,優(yōu)刻得為了能讓國產卡跑起來,需要做非常多的適配、調試。但那時候的“國產卡可能跑著跑著就掛了”。

“原先我們測一些機卡,單卡的性能可能達到英偉達的一定程度。一旦到多卡多機之后,性能就明顯有衰減?!蓖鯐曰蹚膸啄昵伴_始測試一些國產卡,她感覺進步明顯,“我們去年開始已經能看到,這部分已經在緩解,有非常大的提升。”

國產算力也在日新月異地提升。

蛇年開工當天,昆侖芯新一代產品P800萬卡集群點亮。昆侖芯也已適配文心系列、Llama、Qwen、ChatGLM等各類大模型的推理和訓練任務;摩爾線程目前已經適配并拉起了數(shù)百個LLM模型的訓練,在制造業(yè)、工程機械、教育、金融、政務、AI繪畫等眾多行業(yè)得到一定的應用。

楊建認為,今年年底部分大模型的預訓練可能會轉入非英偉達的卡,而明年這種趨勢會更加明顯?!暗搅?026年、2027年,我認為英偉達在美國仍然是最主要的預訓練、甚至后訓練的算力底座。但中國市場會慢慢演變,屆時英偉達會是一部分算力底座,其他國產芯片是另一部分算力底座。全球算力供應變成兩條并行的線路了?!?/p>

目前英偉達GPU在算力性能和生態(tài)成熟度上仍具優(yōu)勢,DeepSeek等大模型的技術迭代短期內難以完全脫離其生態(tài)。但長期來看,隨著國產替代的推進、算法優(yōu)化能力的提升,以及行業(yè)對供應鏈安全的重視,將逐步降低單一依賴風險。

“這一過程需要時間和技術積累,但已是不可逆的趨勢。未來的算力底座更可能呈現(xiàn)‘多元共存’的形態(tài),而非某一廠商的絕對主導。”王華表示。

責任編輯: 胡青
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網友評論
登錄后可以發(fā)言
發(fā)送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換