AI顛覆人機(jī)交互 大廠押寶Agent
來源:21世紀(jì)經(jīng)濟(jì)報(bào)道21財(cái)經(jīng)APP作者:孔海麗2024-11-29 14:31

AI Agent成了大廠必爭(zhēng)之地。

近期,蘋果、谷歌、Antropic、OpenAI紛紛發(fā)布AI Agent進(jìn)展 ,希望用大模型技術(shù)改變?nèi)藱C(jī)交互方式,找到AI最恰當(dāng)?shù)穆涞胤绞健?/p>

這其中,國內(nèi)AI企業(yè)智譜快速布局,領(lǐng)先海外巨頭一個(gè)身位。

繼10月25日首次上線可以代替人類操作手機(jī)和電腦的AI工具之后,11月29日,智譜發(fā)布了AI Agent系列更新。

主打AI接管手機(jī)的AutoGLM,已經(jīng)可以實(shí)現(xiàn)跨APP、跨設(shè)備、長(zhǎng)流程的復(fù)雜步驟。

所謂AutoGLM,是指接收人類簡(jiǎn)單語音指令,自動(dòng)執(zhí)行手機(jī)端復(fù)雜任務(wù),任務(wù)執(zhí)行過程中可以持續(xù)與用戶進(jìn)行交互反饋。

根據(jù)簡(jiǎn)單語音指令,AutoGLM可以在微信、小紅書、美團(tuán)、淘寶、抖音、攜程等APP上執(zhí)行發(fā)布消息、查找店鋪、選購商品、路線導(dǎo)航、訂機(jī)票、訂車票、訂酒店等操作。

銀河證券近日發(fā)布研報(bào)指出,AI Agent的崛起正重塑AI產(chǎn)業(yè)鏈并帶來投資新機(jī)遇,未來,AI Agent模型將改變C端流量入口的分配,或許還會(huì)取代APP的地位,并與硬件爭(zhēng)奪流量入口。

AI實(shí)現(xiàn)復(fù)雜操作

智譜CEO張鵬演示了“AI發(fā)給人類的第一個(gè)紅包”,他發(fā)出“面對(duì)面建群并發(fā)布200個(gè)紅包”的語音指令之后,AutoGLM自動(dòng)執(zhí)行了打開微信、建群、發(fā)群紅包的系列步驟。

當(dāng)然,輸入密碼還是需要人類確認(rèn)的。

據(jù)介紹,AutoGLM可以實(shí)現(xiàn)觸控執(zhí)行、內(nèi)容理解、內(nèi)容生成等大類別任務(wù)。

目前,AutoGLM覆蓋了手機(jī)端主流生活場(chǎng)景APP,包括微信、小紅書、抖音、微博、美團(tuán)、大眾點(diǎn)評(píng)、餓了么、淘寶、京東、拼多多、高德地圖、百度地圖、12306、攜程、去哪兒等。

另外,針對(duì)特殊場(chǎng)景,也可以實(shí)現(xiàn)跨APP操作。

比如,“在小紅書上搜索北京比較正宗的餐廳,找一家合適的在大眾點(diǎn)評(píng)上定位,并在微信上發(fā)送給老婆,告訴我它在美團(tuán)上有哪些推薦菜,幫我高德導(dǎo)航過去”;“對(duì)比攜程和去哪兒下周三從昆明到烏魯木齊的航班價(jià)格”。

GLM-PC是面向PC端的自主Agent,目前開放第一階段的內(nèi)測(cè)場(chǎng)景,包括會(huì)議替身、文檔處理、網(wǎng)頁搜索與總結(jié)、遠(yuǎn)程和定時(shí)操作、隱形屏幕等。

不過,智譜方面坦陳,由于PC和PC任務(wù)的復(fù)雜程度,目前大模型的能力距離真正代替用戶辦公還有一定距離。GLM-PC在當(dāng)前版本下,用戶仍需要輸入非常精準(zhǔn)的指令。

大模型從Chat走向Act

大模型正在改變?nèi)藱C(jī)交互方式,而AI Agent是行業(yè)內(nèi)公認(rèn)的、最具潛力的AI落地方式。

或許,AI Agent可以將移動(dòng)互聯(lián)網(wǎng)時(shí)代的“人適應(yīng)機(jī)器”,推進(jìn)到AI時(shí)代的“讓機(jī)器適應(yīng)人”。

蘋果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業(yè)也已經(jīng)把Agent作為2025年的業(yè)務(wù)重點(diǎn)。

AI Agent能夠讓大模型完全執(zhí)行人類的工作流程,適應(yīng)、學(xué)習(xí)、迭代,與其他系統(tǒng)和人類協(xié)作,并端到端地完成任務(wù)。

在智譜CEO張鵬看來,現(xiàn)階段,AutoGLM相當(dāng)于在人與應(yīng)用之間添加一個(gè)執(zhí)行的調(diào)度層,大幅改變了人機(jī)交互形式。

張鵬認(rèn)為,大模型發(fā)展會(huì)經(jīng)過五個(gè)階段,分別是L1語言能力、L2邏輯能力(多模態(tài)能力)、L3使用工具的能力、 L4自我學(xué)習(xí)能力、 L5探究科學(xué)規(guī)律。

目前,Agent會(huì)極大地提升大模型的L3能力,同時(shí)開啟對(duì)L4自我學(xué)習(xí)能力的探索。

“而且,Agent可以看作是大模型通用操作系統(tǒng)LLM-OS的雛形,未來有可能實(shí)現(xiàn)原生的人機(jī)交互?!睆堸i說。

從產(chǎn)業(yè)端來看,AI Agent有廣闊的市場(chǎng)機(jī)遇。銀河證券預(yù)計(jì),到2028年,中國AI Agent的市場(chǎng)規(guī)模將激增至8520億元,年復(fù)合增長(zhǎng)率達(dá)72.7%。

“AI Agent也會(huì)推動(dòng)APP生態(tài)逐漸向端側(cè)生態(tài)轉(zhuǎn)變,成為AI應(yīng)用發(fā)展新趨勢(shì)。”銀河證券在研報(bào)中指出,AI Agent通過實(shí)現(xiàn)自然語言與硬件的交互,解決端側(cè)AI痛點(diǎn),可能改變C端流量入口的分配機(jī)制。

業(yè)界對(duì)此有共識(shí)。智譜COO張帆也認(rèn)為,AI Agent有望革新智能設(shè)備的生態(tài),手機(jī)+AI會(huì)變成隨身個(gè)人智能助理,PC+AI有機(jī)會(huì)成為全新生產(chǎn)力工具,汽車+AI會(huì)打開汽車更大的想象空間。

責(zé)任編輯: 胡青
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換