具身智能:人工智能的下一個(gè)浪潮 市場規(guī)模已展望到3萬億?
來源:全景財(cái)經(jīng)作者:全小景2023-05-30 20:52
(原標(biāo)題:具身智能:人工智能的下一個(gè)浪潮 市場規(guī)模已展望到3萬億?丨黃金眼)

特斯拉人形機(jī)器人的高速成長、英偉達(dá)創(chuàng)始人半導(dǎo)體大會(huì)重點(diǎn)提及、上交大提出實(shí)施方案,正讓“具身智能”成為市場資金的焦點(diǎn)。

01、什么是“具身智能”?

具身智能其實(shí)是智能科學(xué)的一個(gè)基礎(chǔ)問題,是指具有身體體驗(yàn)的智能。

從認(rèn)知角度看,人類是第一人稱視角的智能,但給機(jī)器喂很多數(shù)據(jù)進(jìn)行學(xué)習(xí),屬于第三人稱的智能,比如給機(jī)器很多盒子,并且標(biāo)注這就是盒子,然后機(jī)器就會(huì)知道這種模式是盒子。但其實(shí),人類是怎么知道這是盒子的?是通過體驗(yàn)才知道的。

1963年的一個(gè)實(shí)驗(yàn)?zāi)芤欢ǔ潭日故緝烧叩膮^(qū)別,圖中的兩只貓,一只貓被綁起來,只能看這個(gè)世界,與其連接的另一只貓則可以主動(dòng)去走。被動(dòng)的貓是一種旁觀的智能,而主動(dòng)的貓是具身的智能,實(shí)驗(yàn)的最后,主動(dòng)體驗(yàn)的貓學(xué)會(huì)了正常行走,但旁觀的貓并沒能獲得行走能力。

資料來源:“機(jī)器之心”公眾號

人工智能屬于很多概念的總和,但其中有些概念很難被測量和驗(yàn)證,例如讓機(jī)器理解什么是社會(huì)、什么是責(zé)任,雖然能輸出一個(gè)表征,但很難檢驗(yàn)機(jī)器是否真正理解這些概念,因此可在一些可驗(yàn)證、可測量的概念上做出一個(gè)閉環(huán),而具身智能剛好是這樣的閉環(huán),是邁向通用智能很好的起點(diǎn)。

近期,英偉達(dá)創(chuàng)始人黃仁勛也在ITF World 2023半導(dǎo)體大會(huì)上表示,AI下一個(gè)浪潮將是“具身智能”,其描述的“具身人工智能”是能夠理解、推理并與物理世界互動(dòng)的智能系統(tǒng),包括機(jī)器人技術(shù)、自動(dòng)駕駛汽車,甚至是聊天機(jī)器人,它們會(huì)更聰明,因?yàn)樗鼈兡芰私馕锢硎澜纭?/p>

02、“具身智能”離我們有多遠(yuǎn)?

早在1950年,圖靈首次提出具身智能的概念。在此后幾十年里,具身智能作為很重要的概念,但并沒有取得很大的進(jìn)展,因?yàn)楫?dāng)時(shí)的技術(shù)還不足以支撐其發(fā)展。

到了今天,多學(xué)科的技術(shù)已經(jīng)改變了這一局面。當(dāng)前各路大模型百花齊放,計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)、自然語言、認(rèn)知科學(xué)等技術(shù)成熟,將推動(dòng)具身智能進(jìn)入快速發(fā)展階段。

不斷高速發(fā)展的AI大模型,有望突破局限,讓機(jī)器人生“智”。

機(jī)器人的大模型包含LLM(大語言模型)、VLM(視覺-語言模型)、VNM(視覺導(dǎo)航模型)。機(jī)器人的“大腦”AI域不局限于ChatGPT運(yùn)用的語言大模型,谷歌在LM-Nav的研究中提到,LLM+VLM+VNM三個(gè)模型相互結(jié)合,從自然語言(冗余口語化描述)到文本(地標(biāo)的字符串)到圖像(根據(jù)文本找圖像中的物體),能夠最終生成機(jī)器人的路徑規(guī)劃。以此行為模式為基礎(chǔ),機(jī)器人能進(jìn)行人機(jī)互動(dòng),同時(shí)實(shí)現(xiàn)一定程度的“隨機(jī)應(yīng)變”。

不久前,上海交通大學(xué)盧策吾教授在機(jī)器之心AI科技年會(huì)上發(fā)表主題演講《具身智能》,提出PIE方案,認(rèn)為具身智能包括3個(gè)模塊:具身感知(Perception)、具身想象(Imagination)和具身執(zhí)行(Execution),有望加速推動(dòng)具身智能落地。

目前看來,AI+機(jī)器人或許正是“具身智能”當(dāng)前的落點(diǎn)。

由于具身智能相較于非智能普通人形機(jī)器人有更高的工作效率,其具備的理解力、交互力、規(guī)劃能力等,在機(jī)器人進(jìn)入千行百業(yè)后,擁有極強(qiáng)的落地實(shí)用性。同時(shí)其能夠用自然語言控制的特性,是未來規(guī)?;瘏f(xié)助普通工作人員的必要條件。

因此,未來可關(guān)注目前可用大模型進(jìn)行改造的硬件機(jī)器人類型及應(yīng)用場景,例如對話為主的服務(wù)機(jī)器人、工業(yè)機(jī)器人、復(fù)雜場景下的人形機(jī)器人等領(lǐng)域。

諸多大廠已在具身智能領(lǐng)域進(jìn)行布局,谷歌發(fā)布史上最大通才模型PaLM-E;微軟探索如何將ChatGPT擴(kuò)展到機(jī)器人領(lǐng)域;阿里巴巴-千問大模型正在實(shí)驗(yàn)接入工業(yè)機(jī)器人等。

其中特斯拉人形機(jī)器人Optimus讓人眼前一亮。

自去年10月特斯拉人形機(jī)器人Optimus首次亮相無法自主行走需要人攙扶,5月17日,特斯拉股東大會(huì)展示視頻中Optimus已經(jīng)可以在車間靈活行走、抓取物體,已經(jīng)擁有環(huán)境探索與記憶、電機(jī)轉(zhuǎn)矩控制能力、基于人類跟蹤運(yùn)動(dòng)的AI訓(xùn)練以及物體操縱能力,且已打通了FSD底層模塊,實(shí)現(xiàn)了一定程度的算法復(fù)用。

Tesla Bot邊走路邊識別并記憶周邊環(huán)境資料來源:計(jì)算機(jī)視覺聯(lián)盟

FSD算法指的是其全自動(dòng)駕駛(Full Self-Driving)系統(tǒng)所采用的算法,采用它是為了實(shí)現(xiàn)車輛的自主導(dǎo)航和自動(dòng)駕駛功能,讓車輛能夠在各種交通環(huán)境下進(jìn)行感知、決策和控制。其主要依賴于神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺技術(shù),核心是神經(jīng)網(wǎng)絡(luò)模型:通過對實(shí)時(shí)傳感器(如相機(jī)、激光雷達(dá)等)獲取的數(shù)據(jù)進(jìn)行處理和分析,并從中提取有關(guān)道路、車輛、行人和障礙物等信息,可以實(shí)現(xiàn)車輛的環(huán)境感知和物體識別。

加上之前OpenAI投資挪威人形機(jī)器人公司1X,以及三花智控與綠的諧波在墨西哥合資設(shè)立諧波減速器公司,AI+機(jī)器人已經(jīng)讓人看到產(chǎn)業(yè)爆發(fā)的跡象。

03、市場規(guī)模有多大?

短期看來,由于技術(shù)不成熟,人形機(jī)器人在B端難有明晰應(yīng)用場景,且未量產(chǎn)的價(jià)格對C端用戶恐較難接受,所以市場集中在特定消費(fèi)人群當(dāng)中。

首先,ASIMO、Atlas、Tesla、小米、優(yōu)必選發(fā)布的機(jī)器人側(cè)重于其運(yùn)動(dòng)能力,對其手眼協(xié)同執(zhí)行生產(chǎn)任務(wù)的能力未過多描述,這意味著短期內(nèi)其難以走入工廠大規(guī)模補(bǔ)充勞動(dòng)力。從技術(shù)看,當(dāng)前人形機(jī)器人還只能基于固定規(guī)則運(yùn)動(dòng),即使投入生產(chǎn)性工作,亦只能局限在有限動(dòng)作與場景,而這又與對人形機(jī)器人“跨場景靈活工作”的期望相悖,尚待控制算法的進(jìn)一步成熟。

其次,當(dāng)前人形機(jī)器人服務(wù)能力主要體現(xiàn)在講解引導(dǎo)、表演方面,還無法較好地完成家務(wù),在家庭場景其與智能音箱的功能更為相似,再加之價(jià)格較高,C端用戶在短期內(nèi)可能不會(huì)大量接受。

雖實(shí)用功能不夠豐富,發(fā)布初期仍可能吸引科技發(fā)燒友、可支配收入充裕的高端消費(fèi)者進(jìn)行購買,此時(shí)人形機(jī)器人滿足的是用戶的科研、嘗鮮、炫耀需求。

前期Tesla Bot價(jià)格或定在50萬元左右,與之相應(yīng)的消費(fèi)人群與當(dāng)前豪華車、超豪華車的購買者重合度較高。不過考慮到人形機(jī)器人購買后實(shí)用性較弱且難以攜帶外出展示,故在高收入人群中的滲透率或?qū)@著低于汽車。

機(jī)構(gòu)預(yù)計(jì)2025-2027年,TeslaBot在豪華車購買者中的滲透率將分別為1%、2%、3%,在超豪華車購買者中的滲透率將分別為6%、7%、8%,帶來的市場規(guī)模分別為520.5、1,022.0、1,523.5億元

資料來源:東吳證券研究所

之后隨著技術(shù)的完善,會(huì)逐步助力機(jī)器人填補(bǔ)制造業(yè)用工缺口。

此階段機(jī)器人的運(yùn)動(dòng)控制能力、續(xù)航持久性得到提升,得以發(fā)揮優(yōu)勢,承接制造業(yè)中跨場景的工作。據(jù)《制造業(yè)人才發(fā)展規(guī)劃指南》,至2025年我國制造業(yè)將有3,000萬的人才缺口,占全球缺口的主要份額。

假設(shè)人形機(jī)器人售價(jià)為37萬元,且2026-2030年在制造領(lǐng)域人形機(jī)器人對人工的新增滲透率相同。預(yù)計(jì)人形機(jī)器人對人工的累計(jì)替代率分別為9%、11%時(shí),2030年新增滲透率分別為1.8%、2.2%,創(chuàng)造的市場規(guī)模分別為1,998、2,442億元.

再伴隨綜合服務(wù)、情感交互能力的完善,人形機(jī)器人或許會(huì)在家庭場景的滲透率開始提升。

此時(shí)人形機(jī)器人或可完成多種較復(fù)雜的家務(wù),實(shí)用能力得以提升,加上價(jià)格下降的因素,此時(shí)不局限于高端消費(fèi)者,有更多家庭愿意在家中添置人形機(jī)器人。以此階段機(jī)器人價(jià)格為25萬元為前提,機(jī)構(gòu)預(yù)測在較悲觀、中性、較樂觀的三種情境下,家庭場景創(chuàng)造的市場規(guī)模或許能分別達(dá)到1.47萬、1.88萬、2.3萬億元,加上工業(yè)、商業(yè)服務(wù)場景總合市場規(guī)?;?qū)⒎謩e達(dá)到1.9萬、2.55萬、3.16萬億元。

之后受益于AI技術(shù)發(fā)展,人機(jī)交互進(jìn)一步提升,能承擔(dān)陪伴、照顧人的功能,還可能在有孩子與老人的家庭中滲透率進(jìn)一步提升。

資料來源:東吳證券研究所

04、產(chǎn)業(yè)鏈相關(guān)企業(yè)有哪些?

參考工業(yè)機(jī)器人,AI+人形機(jī)器人本質(zhì)上也是“硬件+軟件”的組合,雖然特斯拉等企業(yè)會(huì)有一定領(lǐng)先優(yōu)勢,但硬件通常也會(huì)外購。

機(jī)器人產(chǎn)業(yè)鏈由零部件廠商、機(jī)器人本體廠商、系統(tǒng)集成商、終端用戶四個(gè)環(huán)節(jié)組成,本體廠商處于核心地位。工業(yè)機(jī)器人的軟件部分涉及到機(jī)器人的控制以及對下游工藝的理解,需要做到可復(fù)制的同時(shí)滿足不同客戶的需求,這是本體廠商的核心競爭力。而硬件的生產(chǎn)需要規(guī)模效應(yīng),通常采用外購的方式。

目前看來,機(jī)器人產(chǎn)業(yè)鏈相關(guān)企業(yè)有執(zhí)行器總成相關(guān)的三花智控;旋轉(zhuǎn)執(zhí)行器-諧波減速器相關(guān)的綠的諧波、豐立智能、漢宇集團(tuán)、國茂股份,RV減速器相關(guān)的雙環(huán)傳動(dòng)、秦川機(jī)床、中大力德;直線執(zhí)行器-力矩電機(jī)相關(guān)的步科股份,滾珠絲杠相關(guān)的鼎智科技、秦川機(jī)床;指關(guān)節(jié)微型電機(jī)-空心杯電機(jī)相關(guān)的鳴志電器、鼎智科技、江蘇雷利;環(huán)境探索-機(jī)器視覺相關(guān)的奧普特、凌云光。

資料來源:東吳證券研究所繪制

其中三花智控是全球領(lǐng)先的生產(chǎn)和研發(fā)制冷空調(diào)控件元件和零部件的廠商,也是特斯拉汽車熱管理系統(tǒng)核心供應(yīng)商,且已布局機(jī)器人產(chǎn)業(yè)。2023年4月,擬與綠的諧波在三花墨西哥工業(yè)園設(shè)立一家合資企業(yè),主營業(yè)務(wù)為諧波減速器相關(guān)產(chǎn)品的研發(fā)、生產(chǎn)制造及銷售。

綠的諧波則從事精密傳動(dòng)裝置研發(fā)、設(shè)計(jì)和生產(chǎn),業(yè)務(wù)聚焦諧波減速器、機(jī)電一體化產(chǎn)品、工業(yè)自動(dòng)化等產(chǎn)品。諧波減速器是機(jī)器人核心零部件之一,公司已打破了國際品牌在機(jī)器人用諧波減速器領(lǐng)域的壟斷,實(shí)現(xiàn)批量出口。

鳴志電器主營業(yè)務(wù)為控制電機(jī)及其驅(qū)動(dòng)系統(tǒng),控制電機(jī)是核心工業(yè)裝備,公司曾打破日本壟斷,是十年之內(nèi)唯一改變HB(混合式)步進(jìn)電機(jī)全球競爭格局的國內(nèi)企業(yè)。其子公司安浦鳴志,瑞士Tmotion,鳴志派博思深度布局異動(dòng)機(jī)器人行業(yè)。

同時(shí),還有專注于計(jì)算機(jī)視覺領(lǐng)域,為行業(yè)提供算法授權(quán)及系統(tǒng)解決方案,在全球范圍內(nèi)為智能終端機(jī)智能駕駛提供視覺算法產(chǎn)品線的虹軟科技,以機(jī)器視覺、人工智能和導(dǎo)航控制為核心的智能物聯(lián)網(wǎng)龍頭海康威視,以及視頻物聯(lián)網(wǎng)頭部玩家的大華股份,都是機(jī)器視覺相關(guān)受益企業(yè)。

此外,還有中科創(chuàng)達(dá)、商湯科技、云從科技、科大訊飛在內(nèi)的大模型相關(guān)受益類企業(yè)。

責(zé)任編輯: 高蕊琦
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號,即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場
暫無評論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換