郭晨凱 制圖
“剛剛我還在用DeepSeek-R1模型測試本地知識庫,它的文本生成能力比預期的更好?!?月6日,心動公司媒體公關總監(jiān)陳承對上海證券報記者說。
1月20日,DeepSeek正式發(fā)布DeepSeek-R1模型,并同步開源模型權重。DeepSeek模型的橫空出世掀起行業(yè)浪潮,多家公司迎來“破圈時刻”:在軟件端,一批上市公司宣布接入DeepSeek,加速自身AI應用產品升級;在硬件端,端側AI迎來加速發(fā)展契機,2025年或將出現(xiàn)一波AI硬件創(chuàng)業(yè)浪潮。
在昆侖萬維董事長兼CEO方漢看來,DeepSeek的高性價比模型證明了,只要算法先進,訓練成本跟推理成本都可以大幅度下降。這將會刺激整個大模型行業(yè)快速落地,對于整個行業(yè)非常有益。從行業(yè)長期發(fā)展來看,DeepSeek對下游應用落地起到很好的促進作用,所有和編程、數(shù)理推斷相關的行業(yè),如金融、互聯(lián)網、法律等領域,都會得到極大發(fā)展。
中小企業(yè)涌入 AI迎來“破圈時刻”
據了解,DeepSeek-R1的訓練費用不到OpenAI GPT-4o的十分之一,且API定價僅為OpenAI o1的三十分之一。這意味著中小企業(yè)和個人開發(fā)者也能夠輕松使用這種高性能的人工智能技術。
蟻智島科技采用DeepSeek的服務已有半年之久,見證了其版本從v1到v3再到R1的更迭。蟻智島科技CEO隋闊認為,DeepSeek最核心的影響是讓AI“破圈”了,憑借產品硬實力,很多圈外人得以迅速了解這一產品形態(tài)。“春節(jié)回來后不少老板主動聯(lián)系我,想加速推動AI在企業(yè)的落地。雖然還是有理解上的差異,但是DeepSeek接受度大大提高?!?/p>
市場對于DeepSeek的濃厚興趣,也體現(xiàn)在各行各業(yè)的加速布局中。
上海鋼聯(lián)在2月5日發(fā)布的調研紀要中提到,DeepSeek-R1開源推理模型成本低、推理能力強,對大宗商品語義理解的復雜性,能有更好的處理能力。公司表示,希望盡快把基于DeepSeek的“小鋼”做出來,在一季度借助DeepSeek-R1快速蒸餾出全新的“宗師”模型,并切換“小鋼”的基座模型。
2月6日,智云健康宣布將DeepSeek-R1模型接入公司自研醫(yī)療人工智能系統(tǒng)“智云大腦”。這一舉措將增強智云醫(yī)療大腦的數(shù)據挖掘能力,提高慢病管理效率。
中信證券發(fā)布研報稱,DeepSeek是國內AI生態(tài)級的突圍,有望帶動國內AI全產業(yè)的快速發(fā)展。同時,其開源與低成本的特性亦有望賦能AI應用廠商,加速推動端側AI落地。
也有專家提出,未來,大部分的企業(yè)或個人都可以輕松地本地化部署DeepSeek,隨后DeepSeek對于AIGC類公司的影響將逐漸下降。企業(yè)的競爭力依然取決于自身的AI應用場景與產品。
“行業(yè)需要在算法迭代與芯片制造和設計上更進一步,才能真正進入世界先進水平之列。”方漢告訴記者。
隋闊表示,DeepSeek的“破圈”是一個利好,隨著算力、算法、數(shù)據等其他環(huán)節(jié)的迭代優(yōu)化,會有更大的應用前景。DeepSeek開源了R1的訓練方法和流程,大幅提升了訓練效率,但如果企業(yè)要訓練依舊是“天價”。蒸餾模型依舊更適合企業(yè),高質量數(shù)據依舊是核心。
端側AI加速跑激活硬件生態(tài)
事實上,相較于AI軟件,此次由DeepSeek帶動的端側AI加速發(fā)展,有望大幅激活AI硬件的商業(yè)化生態(tài)。
受訪的業(yè)內人士告訴記者,端側AI能優(yōu)化硬件性能,提高運算速度、降低延遲,同時實現(xiàn)更復雜任務與增強交互,并支持更多離線等應用場景,全面提升AI硬件的能力與價值。2025年將是AI眼鏡、AI玩具等AI硬件行業(yè)發(fā)展的重要一年。
從技術層面來看,DeepSeek模型采用改進的算法和架構,實現(xiàn)了算法、框架和硬件的優(yōu)化協(xié)同,提高了模型在端側設備上的運行效率,使端側AI部署變得更加具有普惠性。同時,通過知識蒸餾,將大模型的能力高效遷移到輕量化模型上,開發(fā)者可快速將其AI能力部署至硬件設備并針對場景定制化,降低了智能產品的AI功能集成門檻。
Rokid投資者關系負責人方雨晴表示,在智能眼鏡行業(yè),企業(yè)是否接入大模型主要取決于Token(詞元)價格、平臺穩(wěn)定性和響應速度等因素。企業(yè)可以在前期選擇多個AI大模型供用戶自由選擇。從行業(yè)來看,AI軟硬件公司普遍期待DeepSeek等國產或開源大模型能有更好的發(fā)展,有助于降低行業(yè)開發(fā)周期和投入。據介紹,Rokid專注于AR智能眼鏡的軟硬件研發(fā),并已與通義千問等多模態(tài)大模型建立合作關系。
華安證券研報表示,目前不少國內手機整機廠商推出端側AI功能。基于DeepSeek-R1在推理能力上表現(xiàn)出色,該模型若能進入AI智能終端,將形成具有強大AI功能的產品,有望提升用戶體驗,增強產品吸引力,在與其他廠商的競爭中更具優(yōu)勢。
從產業(yè)鏈來看,DeepSeek也有利于SoC芯片和存儲等行業(yè)的發(fā)展。
“從行業(yè)的長期發(fā)展來說,DeepSeek會催生上游的推理芯片跟訓練芯片的大幅進步?!狈綕h說。
泰凌微副總經理、COO金海鵬對記者表示,隨著蒸餾技術的成熟,可以預見在泰凌微AI芯片上運行的模型也會更強大。不過,這些目標無法在短期內達到,需要時間的積累。公司未來或將在技術適配與優(yōu)化、應用場景融合與生態(tài)合作方面與DeepSeek有交集。從行業(yè)來看,DeepSeek推動端側AI成本降低,使整個端側AI市場需求增長,從而將帶動端側AI芯片公司的市場拓展。
在AI硬件的商業(yè)化落地中,有了DeepSeek也并非高枕無憂。
人形機器人被視為AI硬件應用的終極集成形態(tài)。DeepSeek如果被植入人形機器人中,是否會迎來更大的商機?對此,國內一家機器人公司的相關負責人認為,DeepSeek屬于ChatGPT的大類別,目前還無法深度驅動人形機器人。
陳承也表示,DeepSeek盡管在文本處理方面十分突出,但目前多模態(tài)功能尚屬短板,因而使用場景更聚焦于文本處理及其衍生場景。