據(jù)上海證券報(bào),2月6日,記者從多方確認(rèn),全球頂尖人工智能科學(xué)家許主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集團(tuán)副總裁,負(fù)責(zé)AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及Agents相關(guān)基礎(chǔ)研究與應(yīng)用解決方案。
另?yè)?jù)了解,阿里AI To C業(yè)務(wù)正在組建頂級(jí)AI算法研究和工程團(tuán)隊(duì),吸引大量業(yè)內(nèi)優(yōu)秀人才加盟。
圖片來(lái)源:每日經(jīng)濟(jì)新聞 資料圖
公開(kāi)資料顯示,許主洪教授在人工智能工業(yè)界和學(xué)術(shù)界擁有超20年經(jīng)驗(yàn),曾在新加坡南洋理工大學(xué)、新加坡管理大學(xué)擔(dān)任教授。他發(fā)表的300余篇人工智能頂級(jí)學(xué)術(shù)論文,引用量超過(guò)五萬(wàn)次。他的多篇“多模態(tài)預(yù)訓(xùn)練”主題論文影響力很大,論文引用數(shù)位列當(dāng)年全球前五,其提出的預(yù)訓(xùn)練策略有效降低成本,深刻影響了全球大模型研發(fā)。
作為全球多模態(tài)大模型領(lǐng)域的領(lǐng)軍人物,他曾擔(dān)任全球最大企業(yè)軟件廠商Salesforce集團(tuán)副總裁、亞洲研究院創(chuàng)始院長(zhǎng),從0到1搭建了Salesforce亞洲人工智能研究體系,主導(dǎo)多個(gè)開(kāi)創(chuàng)行業(yè)先河的人工智能研究項(xiàng)目和應(yīng)用產(chǎn)品。2023年,許主洪創(chuàng)立人工智能初創(chuàng)公司,開(kāi)發(fā)出先進(jìn)的多模態(tài)大語(yǔ)言模型,推出了前沿的圖像和視頻生成模型及產(chǎn)品。
據(jù)內(nèi)部人士透露,許主洪將專(zhuān)注于AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及Agents相關(guān)基礎(chǔ)研究與應(yīng)用解決方案,大幅提升阿里巴巴AI應(yīng)用C端產(chǎn)品在模型結(jié)合應(yīng)用的端對(duì)端閉環(huán)能力。有業(yè)內(nèi)人士分析,2025年初,世界級(jí)頂尖科學(xué)家的加盟,可以視為阿里AI To C加碼人才與資源投入的重要信號(hào)。未來(lái),大模型頂級(jí)人才團(tuán)隊(duì)將支撐起阿里AI To C在多模態(tài)Agents等方向的深入探索,也為下一階段構(gòu)建面向用戶的AI應(yīng)用平臺(tái)打開(kāi)了想象空間。
1月29日,阿里云通義千問(wèn)旗艦版模型Qwen2.5-Max正式升級(jí)發(fā)布。
據(jù)微信公眾號(hào)“阿里云”消息,Qwen2.5-Max模型是阿里云通義團(tuán)隊(duì)對(duì)MoE模型的最新成果,預(yù)訓(xùn)練數(shù)據(jù)超過(guò)20萬(wàn)億tokens。新模型展現(xiàn)出極強(qiáng)勁的綜合性能,在多項(xiàng)公開(kāi)主流模型評(píng)測(cè)基準(zhǔn)上錄得高分,全面超越了目前全球領(lǐng)先的開(kāi)源MoE模型以及最大的開(kāi)源稠密模型。目前,開(kāi)發(fā)者可在Qwen Chat平臺(tái)免費(fèi)體驗(yàn)?zāi)P?,企業(yè)和機(jī)構(gòu)也可通過(guò)阿里云百煉平臺(tái)直接調(diào)用新模型API服務(wù)。
官方資料表示,由于無(wú)法訪問(wèn)GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型,通義團(tuán)隊(duì)將Qwen2.5-Max與目前領(lǐng)先的開(kāi)源MoE模型DeepSeek V3、最大的開(kāi)源稠密模型Llama-3.1-405B,以及同樣位列開(kāi)源稠密模型前列的Qwen2.5-72B進(jìn)行了對(duì)比。在所有11項(xiàng)基準(zhǔn)測(cè)試中,Qwen2.5-Max全部超越了對(duì)比模型。
圖片來(lái)源:微信公眾號(hào)阿里云
據(jù)中國(guó)基金報(bào),阿里通義千問(wèn)團(tuán)隊(duì)表示,Qwen2.5-Max采用超大規(guī)模MoE(混合專(zhuān)家)架構(gòu),基于超過(guò)20萬(wàn)億token的預(yù)訓(xùn)練數(shù)據(jù)及精心設(shè)計(jì)的后訓(xùn)練方案進(jìn)行訓(xùn)練。
據(jù)介紹,Qwen2.5-Max在知識(shí)、編程、全面評(píng)估綜合能力以及人類(lèi)偏好對(duì)齊等主流權(quán)威基準(zhǔn)測(cè)試上,展現(xiàn)出全球領(lǐng)先的模型性能。指令模型是所有人可直接對(duì)話體驗(yàn)到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準(zhǔn)測(cè)試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
值得注意的是,除了發(fā)布Qwen2.5-Max以外,1月28日,阿里還開(kāi)源了全新的視覺(jué)理解模型Qwen2.5-VL,推出了3B、7B、72B三個(gè)尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項(xiàng)權(quán)威評(píng)測(cè)中奪得視覺(jué)理解冠軍,全面超越GPT-4o與Claude3.5。
截至2月6日發(fā)稿,阿里巴巴-W(HK9988)報(bào)97.95港元,漲幅0.41%,市值1.9萬(wàn)億港元。
校對(duì):姚遠(yuǎn)