階躍星辰,這家鮮少出現(xiàn)在公眾視野的大模型創(chuàng)業(yè)公司,演繹了“悄悄變厲害,然后驚艷所有人”的故事。
近日,有消息稱階躍星辰成為融資市場的新寵兒,正在進行一輪估值20億美元的新融資,阿里巴巴也在投資者名單之中。20億美元,這可以算得上是一個天文數(shù)字。目前,大模型創(chuàng)業(yè)領(lǐng)域公認(rèn)有“五小虎”(智譜AI、月之暗面、百川智能、零一萬物、Minimax),即便是此前屢獲資本青睞的月之暗面,目前的投后估值也只是25億美元,而最近獲中東資本加持的智譜AI,其估值約為30億美元。
此輪融資將階躍星辰送上“AI獨角獸”的寶座,使大模型競爭格局從“五小虎”變成“六小強”。這家低調(diào)神秘的大模型公司,有何來頭?
“極端i人”創(chuàng)辦“微軟系”大模型公司
相比于大模型“五小虎”,階躍星辰在融資方面十分低調(diào)。目前,市場上搜不到關(guān)于這家公司的任何公開估值,在天眼查等平臺上也查不到公司的任何一輪融資信息。從只言片語的融資報道中,我們只能得出啟明、五源等一線風(fēng)投參與了公司此前的幾輪融資,字節(jié)曾考慮投資而最終并未出手,以及在新一輪20億美元的融資中,阿里巴巴欲參投。
其低調(diào)務(wù)實的作風(fēng),與公司的“掌舵人”姜大昕不無關(guān)系。在某次罕見接受媒體采訪時,姜大昕就表示自己是一個“極端的i人”(即內(nèi)向型人格),極少出現(xiàn)在鎂光燈下。
階躍星辰是一家“微軟系”的創(chuàng)業(yè)公司。公開資料顯示,2007年,姜大昕加入微軟亞洲研究院任首席研究員,開啟了在微軟長達16年的職業(yè)生涯。作為數(shù)據(jù)挖掘和自然語言處理(NLP)領(lǐng)域的“大?!?,他在該領(lǐng)域的頂級刊物發(fā)表了近200篇論文。在微軟工作期間,他曾任微軟亞洲互聯(lián)網(wǎng)工程研究院副院長和首席科學(xué)家,主導(dǎo)研發(fā)了微軟搜索引擎Bing、智能語音助手Cortana、微軟云Azure,以及辦公全家桶Microsoft 365。
ChatGPT的橫空出世,給姜大昕帶來了巨大的沖擊與震撼,也促使其離開工作多年的老東家,開啟創(chuàng)業(yè)之路?!拔乙庾R到ChatGPT是一個劃時代的技術(shù)變革。一定要自己下場,以最快速、最靈活、最全面的方式來投身到變革中去。”提及為何離職創(chuàng)業(yè)時,姜大昕說道。
2023年4月,階躍星辰正式成立。憑借著姜大昕在人工智能領(lǐng)域的多年深耕以及對人才的強大號召力,他在短時間內(nèi)就聚集了多位人工智能界頂尖人才,核心創(chuàng)始團隊包括系統(tǒng)負(fù)責(zé)人朱亦博和數(shù)據(jù)負(fù)責(zé)人焦斌星。公開資料顯示,朱亦博曾在微軟、字節(jié)跳動、谷歌等公司工作過,擁有多次單集群萬卡以上的系統(tǒng)建設(shè)與管理實踐經(jīng)驗。焦斌星此前擔(dān)任微軟必應(yīng)引擎核心搜索團隊負(fù)責(zé)人,負(fù)責(zé)利用數(shù)據(jù)挖掘和NLP算法優(yōu)化索引和搜索質(zhì)量。
“基礎(chǔ)模型+AI應(yīng)用”兩條腿走路
創(chuàng)業(yè)一年后,階躍星辰在今年3月才“姍姍來遲”,正式對外發(fā)布了自研的大模型——Step系列通用大模型。該系列大模型包括Step-1千億參數(shù)語言大模型、Step-1V千億參數(shù)多模態(tài)大模型,以及Step-2萬億參數(shù)MoE (Mixture of Experts,混合專家模型)語言大模型預(yù)覽版。
與此同時,階躍星辰還發(fā)布了兩款To C的AI應(yīng)用產(chǎn)品,分別是躍問與冒泡鴨。其中,躍問是一款定位為個人助手的AI聊天類應(yīng)用,冒泡鴨是一款由劇情和角色構(gòu)成的AI開放世界,主要服務(wù)用戶的娛樂和社交。
由此可以看出,階躍星辰走的是“基礎(chǔ)模型+AI應(yīng)用”兩條線并行、所謂“雙輪驅(qū)動”的大模型創(chuàng)業(yè)路線。在姜大昕看來,模型和產(chǎn)品的關(guān)系就像是“靈魂”與“皮囊”,作為靈魂的模型更加有趣一點,才能顯示出作為皮囊的產(chǎn)品的不同。因此,在打造更加智能的基礎(chǔ)模型上,階躍星辰一直不遺余力。
姜大昕曾公開表示,自己是Scaling Law(縮放定律)的堅定信仰者。所謂Scaling Law,即隨著模型大小、數(shù)據(jù)集大小和用于訓(xùn)練的計算浮點數(shù)的增加,模型的性能會不斷提高,模型參數(shù)量決定模型智能水平的上限。因此,完成Step-1千億參數(shù)語言大模型的訓(xùn)練后,階躍星辰又馬不停蹄地投入Step-2萬億參數(shù)大模型的訓(xùn)練工作。據(jù)了解,階躍星辰也是國內(nèi)第一個公布萬億參數(shù)MoE大模型的公司。
據(jù)了解, Step-1千億參數(shù)語言大模型在邏輯推理、中文知識、英文知識、數(shù)學(xué)、代碼方面表現(xiàn)出色,性能全面超越GPT-3.5。Step-2萬億參數(shù)語言大模型聚焦深度智能的探索,參數(shù)量增長了一個數(shù)量級,對算力、系統(tǒng)、數(shù)據(jù)、算法四個方面都提出了極高的要求,業(yè)內(nèi)只有極少數(shù)公司能做到。業(yè)內(nèi)認(rèn)為,訓(xùn)練萬億參數(shù)模型體現(xiàn)了階躍星辰的核心技術(shù)能力,也說明了公司探索通用人工智能的決心。
目前,階躍星塵的產(chǎn)品主要面向C端客戶。雖然在基礎(chǔ)模型方面擁有較強的技術(shù)實力,但公司也一直在加強AI應(yīng)用產(chǎn)品方面的探索。在姜大昕看來,技術(shù)不是一家公司的護城河,只能提供一個窗口期。在這個窗口期內(nèi),一定要構(gòu)建公司產(chǎn)品的護城河。
而對于公司的融資情況,以及為何在融資方面如此低調(diào),姜大昕則表示,階躍星辰的最終的目標(biāo)是把模型訓(xùn)出來。“人工智能領(lǐng)域確實有一批投資人是非常懂的,他們知道這是一個長期且比較耗錢的項目,也愿意相信我們的技術(shù)實力?!苯箨空f。
校對:楊立林