重磅發(fā)布!剛剛,全線大漲!
來源:證券時(shí)報(bào)網(wǎng)作者:周樂2025-04-30 14:45

一則消息突然引爆。

今日,小米系集體爆發(fā),小米集團(tuán)一度大漲超5%,金山云一度大漲超18%。消息面上,小米大模型微信公眾號(hào)稱,小米開源首個(gè)為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。

當(dāng)前,AI大模型競(jìng)爭(zhēng)再度進(jìn)入白熱化。4月29日,阿里巴巴通義千問發(fā)布了新版Qwen3系列模型。同一天,世界首富馬斯克也宣布,下周Grok 3.5早期測(cè)試版將向SuperGrok訂閱者發(fā)布。

券商機(jī)構(gòu)分析認(rèn)為,國內(nèi)外大模型能力差距縮小,國產(chǎn)算力芯片持續(xù)進(jìn)化,國內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入,為國內(nèi)AI突圍之路奠定了基石。伴隨國內(nèi)外巨頭大模型持續(xù)迭代,C端或有望迎來殺手級(jí)應(yīng)用。

全線大漲

4月30日,小米系全線拉升,小米集團(tuán)盤中一度大漲超5%,金山云一度大漲超18%,金山軟件最高漲超6%。

與此同時(shí),港股云計(jì)算板塊持續(xù)拉升,截至午間收盤,金蝶國際漲4.7%,中國軟件國際漲2.72%,阿里巴巴-W漲1.48%?

據(jù)“小米大模型”公眾號(hào)消息,今日,小米開源首個(gè)為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。

據(jù)介紹,在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開測(cè)評(píng)集上,MiMo以7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。

官方稱,在相同RL訓(xùn)練數(shù)據(jù)情況下,MiMo-7B的數(shù)學(xué)&代碼領(lǐng)域的強(qiáng)化學(xué)習(xí)潛力顯著領(lǐng)先。iMo-7B全系列模型均已開源。

小米技術(shù)團(tuán)隊(duì)表示,MiMo的核心突破在于預(yù)訓(xùn)練與后訓(xùn)練階段的協(xié)同優(yōu)化。在預(yù)訓(xùn)練階段,模型通過挖掘高質(zhì)量推理語料并合成約2000億tokens專項(xiàng)數(shù)據(jù),采用三階段漸進(jìn)訓(xùn)練策略,累計(jì)訓(xùn)練量達(dá)25萬億tokens。

后訓(xùn)練階段則引入創(chuàng)新強(qiáng)化學(xué)習(xí)技術(shù),包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略,有效提升模型在復(fù)雜任務(wù)中的穩(wěn)定性。技術(shù)團(tuán)隊(duì)還開發(fā)了“Seamless Rollout”系統(tǒng),使訓(xùn)練效率提升2.29倍,驗(yàn)證速度加快1.96倍。

值得注意的是,小米官方表示,MiMo-7B在相同強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)下,數(shù)學(xué)與代碼領(lǐng)域的表現(xiàn)顯著優(yōu)于當(dāng)前業(yè)界廣泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

目前,小米已在HuggingFace平臺(tái)開源MiMo-7B全系列4個(gè)模型,并發(fā)布詳細(xì)技術(shù)報(bào)告。

值得一提的是,就在小米宣布“Xiaomi Mimo”開源前,阿里巴巴通義千問于4月29日凌晨發(fā)布了新版Qwen3系列模型,包括2個(gè)MoE模型和6個(gè)dense模型。

通義千問表示,作為Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多個(gè)權(quán)威評(píng)測(cè)中表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。在相同計(jì)算資源下,Qwen 3模型以更小的規(guī)模實(shí)現(xiàn)了對(duì)更大體量上一代模型的超越,真正做到了“小而強(qiáng)大”。

Qwen 3融合了推理與非推理能力,在邏輯分析和創(chuàng)意生成等任務(wù)中表現(xiàn)卓越。預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到約36萬億 tokens,并通過多輪大規(guī)模強(qiáng)化學(xué)習(xí)與精細(xì)優(yōu)化,在推理、工具調(diào)用、指令遵循及多語言能力等方面顯著提升。

“AI大模型大戰(zhàn)”再起

值得注意的是,AI大模型競(jìng)爭(zhēng)再度進(jìn)入白熱化。

4月29日,馬斯克在社交平臺(tái)上宣布,下周,Grok 3.5早期測(cè)試版將向SuperGrok訂閱者發(fā)布,它是第一個(gè)能夠準(zhǔn)確回答有關(guān)火箭發(fā)動(dòng)機(jī)或電化學(xué)技術(shù)問題的人工智能。馬斯克稱,Grok是從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。

2025年以來,全球AI大模型的競(jìng)爭(zhēng)愈發(fā)激烈,據(jù)不完全統(tǒng)計(jì),在過去119天內(nèi),中美十家主要大模型公司就發(fā)布或更新了14款基礎(chǔ)大模型。

國際市場(chǎng)調(diào)研機(jī)構(gòu)Artificial Analysis發(fā)布的報(bào)告顯示,美國大模型雖然目前還領(lǐng)先,但中國的差距在不斷縮小。

西部證券指出,AI大模型能力提升和使用成本下降是主旋律,多模態(tài)或逐步成為未來基礎(chǔ)模型的標(biāo)配,進(jìn)一步拉動(dòng)算力需求。國內(nèi)外大模型能力差距縮小,國產(chǎn)算力芯片持續(xù)進(jìn)化,國內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入,為國內(nèi)AI突圍之路奠定了基石。

開源證券認(rèn)為,AI Agent為以大語言模型(LLM)為驅(qū)動(dòng),具有自主理解、感知、規(guī)劃、記憶和使用工具的能力,能自動(dòng)執(zhí)行復(fù)雜任務(wù)的系統(tǒng)。不同于傳統(tǒng)人工智能,AI Agent具備通過獨(dú)立思考、調(diào)用工具逐步完成給定目標(biāo)的能力??春肁I Agent應(yīng)用將在2025年多點(diǎn)開花,其中AI Agent有望在B端率先商業(yè)化,電商、營銷、CRM、金融、法律等場(chǎng)景加速落地。伴隨國內(nèi)外巨頭大模型持續(xù)迭代,C端或有望迎來殺手級(jí)應(yīng)用。

天風(fēng)證券表示,通義千問體系在模型能力、硬件能力及生態(tài)建設(shè)上保持領(lǐng)先,已實(shí)現(xiàn)全模態(tài)覆蓋,成為全球最大模型開源生態(tài)。其自主算力體系較強(qiáng),覆蓋通用計(jì)算與智算需求,在自主可控行業(yè)具有優(yōu)勢(shì)。AI Agent市場(chǎng)規(guī)模有望超萬億,通義千問憑借在B端資源稟賦及深厚技術(shù)積淀,已發(fā)布多行業(yè)垂直生態(tài)體系,有望成為B端Agent鏈主,相關(guān)生態(tài)體系公司或?qū)⑹芤妗?/p>

排版:王璐璐

校對(duì):陶謙???

責(zé)任編輯: 冉超
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換