中新社北京2月6日電 (記者 夏賓)乙巳蛇年,中國大模型密集“上新”,引發(fā)各方關(guān)注。
一邊是阿里云旗下大模型全新版本升級發(fā)布。1月29日凌晨,阿里云通義團隊發(fā)布的Qwen2.5-Max,該模型是阿里云通義團隊對MoE(混合專家模式)模型的最新探索成果,預(yù)訓(xùn)練數(shù)據(jù)超過20萬億tokens。該新模型展現(xiàn)強勁的綜合性能,在多項公開主流模型評測基準(zhǔn)上錄得高分。
另一邊是DeepSeek(深度求索)大模型迎來大量新平臺的接入上架。2月5日,華為表示,DeepSeek系列新模型正式上線昇騰社區(qū)。
此前,國家超算互聯(lián)網(wǎng)平臺也已上線DeepSeek系列模型。用戶目前也可在百度智能云、騰訊云、360數(shù)字安全等平臺上調(diào)用DeepSeek模型。
第三方大模型性能測試平臺Chatbot Arena近日公布的最新大模型盲測榜單顯示,包括DeepSeek、阿里云、智譜在內(nèi)的多家中國公司旗下大模型憑借出眾的性能躋身前列,這些國產(chǎn)大模型在部分單項性能上也實現(xiàn)了對海外主流大模型的趕超。
據(jù)悉,Chatbot Arena目前已集成190多種模型,該平臺推出的測評榜單采用匿名方式將大模型兩兩組隊,交給用戶盲測,用戶根據(jù)真實對話體驗對模型能力進行投票。
上述榜單成績在中外社交媒體上引發(fā)熱議。在小紅書上,“大模型中國造”成了新詞,有網(wǎng)友直言:“期待國產(chǎn)大模型越來越好,給海內(nèi)外帶來新的震撼!”
在X上,不少海外網(wǎng)友表示,中國新模型的迭代速度和質(zhì)量令人驚艷,甚至還有人打趣地為OpenAI首席執(zhí)行官奧特曼(Sam Altman)擔(dān)憂。
平安證券研究報告稱,近期,國產(chǎn)大模型產(chǎn)品密集更新和迭代升級,中國算法能力及模型效果逐漸接近和趕超國際主流產(chǎn)品,國產(chǎn)大模型應(yīng)用落地步伐有望加速。
微軟首席執(zhí)行官薩提亞·納德拉在今年的冬季達沃斯論壇上表示,DeepSeek的新模型令人印象深刻,尤其是在如何高效開發(fā)開源模型并進行推理計算方面,它的計算效率非常出色。“我們應(yīng)當(dāng)非常、非常認(rèn)真地對待來自中國的這些技術(shù)進展。”
華泰證券策略研究近期發(fā)布報告則提到,中美科技股估值在過去兩年分化顯著,AI發(fā)展水平或是關(guān)鍵。DeepSeek具有低成本、高性能優(yōu)勢,引發(fā)行業(yè)對資本開支、應(yīng)用場景等討論,或推動投資者重新評估中國科技企業(yè)的技術(shù)潛力,進而催化中美科技股價值重估。
中信證券研究報告認(rèn)為,2025年有望成為A股市場主題投資大年,主題賽道是市場普遍關(guān)注的焦點,多個因素將共同推動2025年全年A股市場的主題投資機遇,其中之一便是,在AI等新技術(shù)成熟和新商業(yè)模式清晰催化下,更多新興產(chǎn)業(yè)有望步入高速成長期。(完)