具身智能能夠以主人公的視角去自主感知物理世界,不再僅僅被動(dòng)地等待數(shù)據(jù)投喂,而是通過與環(huán)境的交互不斷學(xué)習(xí)和積累經(jīng)驗(yàn),用擬人化的思維路徑去理解和適應(yīng)環(huán)境。
一、具身智能概述
1.具身智能的定義
具身智能,是指人工智能+機(jī)器人等物理實(shí)體。按使用用途和場景的不同,具身智能可以有多種形態(tài),包括各類智能機(jī)器人,如人形機(jī)器人、仿生機(jī)器人、自動(dòng)駕駛等。
人工智能(能力)是智能機(jī)器所執(zhí)行的通常與人類智能有關(guān)的智能行為。這些智能行為涉及學(xué)習(xí)、感知、思考、理解、識(shí)別、判斷、推理、證明、通信、設(shè)計(jì)、規(guī)劃、行動(dòng)和問題求解等活動(dòng)。具身智能特別強(qiáng)調(diào)智能的提升,不僅通過算法和計(jì)算實(shí)現(xiàn)智能,更通過本體與環(huán)境的交互實(shí)現(xiàn)智能并不斷提升智能。
《中國大百科全書》對機(jī)器人的定義為:能靈活地完成特定的操作和運(yùn)動(dòng)任務(wù),并可再編程序的多功能操作器。按照這一定義,機(jī)器人包含多種形態(tài),例如人形機(jī)器人、機(jī)械臂、仿生機(jī)器人,球形機(jī)器人等。
2.具身智能商業(yè)化模式
具身智能想要具備高泛化性和可靠性,需要在真實(shí)物理世界里獲取數(shù)據(jù)來完善模型,而獲取真實(shí)物理世界的數(shù)據(jù)的關(guān)鍵就在于商業(yè)化落地。根據(jù)1XAI副總裁Eric Jang在個(gè)人博客網(wǎng)站上發(fā)表的“All Roads Lead to Robotics”一文,具身智能的商業(yè)化路徑主要包括三種:通用場景軟硬結(jié)合、軟件路徑、以及垂直領(lǐng)域軟硬結(jié)合。通用路線技術(shù)難度高,商業(yè)模式是向B端或C端銷售帶有智能能力的完整的機(jī)器人。軟件路徑能夠?qū)崿F(xiàn)機(jī)器人的快速部署和迭代,商業(yè)模式主要是向硬件廠商或綜合型廠商提供API接口。垂直領(lǐng)域軟硬結(jié)合路徑下,機(jī)器人硬件與數(shù)據(jù)強(qiáng)綁定,公司能夠收集和處理特定類型的數(shù)據(jù)。
5.具身智能產(chǎn)業(yè)鏈全景圖譜
具身智能產(chǎn)業(yè)鏈較長。上游主要為原材料和零部件供應(yīng);中游為本體制造與系統(tǒng)集成;下游為具身智能的應(yīng)用領(lǐng)域。
二、具身智能行業(yè)發(fā)展政策
國家頻繁發(fā)布關(guān)于機(jī)器人和人工智能的相關(guān)政策,特別關(guān)注具身智能這一產(chǎn)業(yè)的關(guān)鍵領(lǐng)域!遁p工業(yè)數(shù)字化轉(zhuǎn)型實(shí)施方案(征求意見稿)》《關(guān)于規(guī)范中央企業(yè)采購管理工作的指導(dǎo)意見》和《國家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南》(征求意見稿)等政策的發(fā)行,為具身智能行業(yè)發(fā)展提供了環(huán)境。
三、具身智能行業(yè)現(xiàn)狀
1.人形機(jī)器人潛在市場規(guī)模
AI下一個(gè)浪潮將是“具身智能”,潛在萬億賽道前景廣闊。2024年5月16日,NVIDIA(英偉達(dá))創(chuàng)始人黃仁勛表示,下一波人工智能浪潮是“具身人工智能”。以人形機(jī)器人為例,至2024年,中國人形機(jī)器人市場規(guī)模將達(dá)到約27.6億元。到2029年,該市場規(guī)模有望擴(kuò)大至750億元,占據(jù)全球市場的32.7%。此外,報(bào)告還進(jìn)一步展望,到2035年,中國人形機(jī)器人市場規(guī)模有望達(dá)到3000億元。
2.人形機(jī)器人主要產(chǎn)品形態(tài)
人形機(jī)器人作為具身智能的典型代表,被視為實(shí)現(xiàn)具身智能的最佳載體之一。
3.人形機(jī)器人產(chǎn)品案例——特斯拉Optimus
特斯拉Optimus機(jī)器人身高172cm,體重73kg,全身自由度共28個(gè)(不含靈巧手),用電功率靜坐/慢走時(shí)為100/500W;能夠硬拉68公斤,負(fù)重20公斤,擁有媲美人類的手和工作能力,可完成在工廠搬運(yùn)箱、澆水植物、移動(dòng)金屬棒等復(fù)雜動(dòng)作。
2022年特斯拉AI Day,馬斯克預(yù)計(jì)到2025-2027年Optimus售價(jià)將控制在2萬美元以內(nèi),成本大幅下降,市場空間遠(yuǎn)期或超汽車業(yè)務(wù)。
4.具身智能重點(diǎn)企業(yè)布局
具身智能行業(yè)作為人工智能與機(jī)器人技術(shù)深度融合的新興領(lǐng)域,吸引了眾多企業(yè)紛紛布局,以下是相關(guān)企業(yè)的布局概述:
5.具身智能企業(yè)分布情況
具身智能行業(yè)企業(yè)主要集中在東部沿海地區(qū)和部分中部地區(qū)。北京、上海、浙江、廣東和安徽等地是企業(yè)分布較為密集的區(qū)域。廣東成為具身智能高地,眾多科技企業(yè)、整車廠商和機(jī)器人廠商,紛紛布局大模型,自動(dòng)駕駛和機(jī)器人。
四、具身智能重點(diǎn)企業(yè)分析
1.宇樹科技
杭州宇樹科技是一家世界知名的民用機(jī)器人公司,專注于消費(fèi)級(jí)、行業(yè)級(jí)高性能通用足式/人形機(jī)器人及靈巧機(jī)械臂的自主研發(fā)、生產(chǎn)和銷售。
宇樹高度重視自主研發(fā)和科技創(chuàng)新,全自研電機(jī)、減速器、控制器、激光雷達(dá)等機(jī)器人關(guān)鍵核心零部件和高性能感知及運(yùn)動(dòng)控制算法,整合機(jī)器人全產(chǎn)業(yè)鏈,在足式機(jī)器人領(lǐng)域達(dá)到全球技術(shù)領(lǐng)先。目前累計(jì)申請國內(nèi)外專利180余項(xiàng),授權(quán)專利150余項(xiàng)。
目前公司產(chǎn)品包括:幾款機(jī)器狗和2款人形機(jī)器人。宇樹H1在2023/8/15發(fā)布,2023年Q4左右發(fā)貨,預(yù)計(jì)售價(jià)幾十萬人民幣以內(nèi),定位是通用人形機(jī)器人。身高180cm,體重47kg,步行速度>1.5m/s,潛在運(yùn)動(dòng)能力>5m/s。自由度:單腿5(髖*3+膝*1+踝*1)*2+單臂4*2+靈巧手選配(在研)。搭配自研M107關(guān)節(jié)電機(jī),峰值扭矩密度89Nm/kg,最大關(guān)節(jié)扭矩360Nm,采用中空走線。
2.優(yōu)必選
深圳市優(yōu)必選科技股份有限公司成立于2012年3月31日,為一家總部位于中國的知名機(jī)器人公司,致力于智能服務(wù)機(jī)器人及智能服務(wù)機(jī)器人解決方案的設(shè)計(jì)、生產(chǎn)、商業(yè)化、銷售及營銷以及研發(fā)。公司的產(chǎn)品在不同程度上配備了感知、交互、分析及處理人類指令及外部環(huán)境(如建圖、溫度測量及人臉識(shí)別)的智能功能,范圍涵蓋消費(fèi)級(jí)機(jī)器人及電器,針對教育、物流及其他行業(yè)定制的企業(yè)級(jí)智能服務(wù)機(jī)器人及智能服務(wù)機(jī)器人解決方案。
根據(jù)2023年公司財(cái)報(bào),優(yōu)必選2023年實(shí)現(xiàn)營業(yè)收入10.56億元,歸母凈利潤-12.34億元。
2023年優(yōu)必選營收構(gòu)成中,36.9%由物流智能機(jī)器人及智能機(jī)器人解決方案創(chuàng)造,32.9%由教育智能機(jī)器人及智能機(jī)器人解決方案創(chuàng)造,24%由消費(fèi)級(jí)機(jī)器人及其他硬件設(shè)備創(chuàng)造,5.9%由其他產(chǎn)業(yè)定制智能機(jī)器人及智能機(jī)器人解決方案創(chuàng)造。
3.智元機(jī)器人
上海智元新創(chuàng)技術(shù)有限公司成立于2023年2月,是一家致力于以AI+機(jī)器人的融合創(chuàng)新、打造世界級(jí)領(lǐng)先的具身智能機(jī)器人產(chǎn)品及應(yīng)用生態(tài)的創(chuàng)新企業(yè)。創(chuàng)始團(tuán)隊(duì)包括“稚暉君”彭志輝在內(nèi)的多位業(yè)內(nèi)資深人士,背景綜合互補(bǔ),具有深厚的核心技術(shù)背景、產(chǎn)業(yè)管理經(jīng)驗(yàn)和產(chǎn)業(yè)資源。截止到目前智元機(jī)器人已完成了天使輪、A輪、A1輪、A1+輪、A2輪、A3輪、A4輪等多輪融資。2023年8月,智元機(jī)器人發(fā)布第一代通用型具身智能機(jī)器人原型機(jī)——遠(yuǎn)征A1;2024年8月,智元機(jī)器人家族系列商用產(chǎn)品發(fā)布,在交互服務(wù)、柔性智造、特種作業(yè)、科研教育及數(shù)據(jù)采集等場景開啟商用量產(chǎn)。
8月18日,智元機(jī)器人在2024年度新品發(fā)布會(huì)“智元遠(yuǎn)征商用啟航”上,發(fā)布了“遠(yuǎn)征”與“靈犀”兩大家族共計(jì)五款商用人形機(jī)器人新品,包括:遠(yuǎn)征A2、遠(yuǎn)征A2-W、遠(yuǎn)征A2-Max、靈犀X1及靈犀X1-W。其中,遠(yuǎn)征A2、遠(yuǎn)征A2-Max及靈犀X1為雙足人形機(jī)器人,遠(yuǎn)征A2-W及靈犀X1-W為輪式機(jī)器人。輪式與足式兩種形態(tài)的結(jié)合下,智元機(jī)器人家族有望覆蓋交互服務(wù)、柔性智造、特種作業(yè)、科研教育和數(shù)據(jù)采集等多種類應(yīng)用場景。此外,智元還公布了在機(jī)器人動(dòng)力域、感知域、通信域、控制域一系列自主研發(fā)的技術(shù)成果及具身智能數(shù)據(jù)系統(tǒng)AIDEA。其中,WaIker X高130厘米,重63kg,自由度41個(gè),能夠?qū)崿F(xiàn)復(fù)雜地形自適應(yīng)平穩(wěn)快速行走,具備多模態(tài)情感交互仿人共情表達(dá)能力。優(yōu)必選CTO熊友軍表示,Walker正按照規(guī)劃推進(jìn)商業(yè)化應(yīng)用,最終的目標(biāo)是走入家庭。
4.小米集團(tuán)-W
小米科技2024年3月28日正式推出智能電動(dòng)汽車。其業(yè)務(wù)分部為手機(jī)×AIoT(智能手機(jī)、loT與生活消費(fèi)產(chǎn)品、互聯(lián)網(wǎng)服務(wù)與其他相關(guān)業(yè)務(wù))和智能電動(dòng)汽車等創(chuàng)新業(yè)務(wù)。
小米CyberOne身高177CM,體重52KG,最大模組峰值扭矩300Nm,峰值功率密度96Nm/kg,全身自由度為21,時(shí)速可達(dá)3.6km/h。CyberOne配備Mi-Sense視覺空間系統(tǒng)模塊,8米內(nèi)深度信息精度達(dá)1%;可識(shí)別85種環(huán)境語義和6類45種人類情感。雷軍表示,鐵大還需要漫長時(shí)間去學(xué)習(xí)完善,目前一臺(tái)機(jī)器人的成本高達(dá)六七十萬,尚無法量產(chǎn)。
根據(jù)2024年第三季度財(cái)報(bào),小米集團(tuán)2024年前3季度實(shí)現(xiàn)營業(yè)收入2569億元,歸母凈利潤146.3億元。
第3季度,小米實(shí)現(xiàn)營收925.07億元。其中,智能手機(jī)創(chuàng)造營業(yè)收入474.52億元,占比51.30%;loT與生活消費(fèi)產(chǎn)品創(chuàng)造營收261.02億元,占比28.22%;智能電動(dòng)汽車等創(chuàng)新業(yè)務(wù)創(chuàng)造營收96.97億元,占比10.48%;互聯(lián)網(wǎng)服務(wù)創(chuàng)造84.62億元,占比9.15%;其他相關(guān)服務(wù)創(chuàng)造7.92億元,占比0.86%。
5.科大訊飛
科大訊飛股份有限公司是一家專業(yè)從事語音及語言、自然語言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等人工智能核心技術(shù)研究,人工智能產(chǎn)品研發(fā)和行業(yè)應(yīng)用落地的國家級(jí)骨干軟件企業(yè)。公司主要產(chǎn)品和服務(wù)為訊飛開放平臺(tái)及消費(fèi)者業(yè)務(wù)、智慧教育、智慧醫(yī)療、智慧城市、智慧金融、智慧汽車。
科大訊飛機(jī)器人開放平臺(tái)旨在賦能機(jī)器人硬件,快速接入AI能力,并提供可視化開發(fā)機(jī)器人業(yè)務(wù)以及項(xiàng)目管控和運(yùn)營監(jiān)測能力。實(shí)現(xiàn)可復(fù)用化、服務(wù)統(tǒng)一化、流程角色優(yōu)化、運(yùn)營監(jiān)控化和資源管控化,使平臺(tái)成為一個(gè)強(qiáng)大的機(jī)器人能力支持中心。最終依托機(jī)器人開放平臺(tái),賦能于機(jī)器人產(chǎn)業(yè)公司,建立機(jī)器人合作生態(tài),推動(dòng)機(jī)器人產(chǎn)業(yè)持續(xù)健康快速的發(fā)展。
機(jī)器人超腦平臺(tái),更強(qiáng)調(diào)多模態(tài)感知交互和基于大模型的機(jī)器人大腦。依托科大訊飛超腦2030技術(shù)底座,面向物理世界、數(shù)字世界和元宇宙,推出以AI能力星云、多模態(tài)交互、智能運(yùn)動(dòng)、模型訓(xùn)練、資產(chǎn)生成和軟硬件接入為核心的機(jī)器人開發(fā)平臺(tái),幫助開發(fā)者快速搭建懂知識(shí)、善學(xué)習(xí)、能進(jìn)化的實(shí)體機(jī)器人和虛擬數(shù)字人產(chǎn)品,讓機(jī)器人走進(jìn)每個(gè)行業(yè)和家庭。
根據(jù)2023年公司財(cái)報(bào),科大訊飛實(shí)現(xiàn)營業(yè)收入196.5億元,歸母凈利潤6.57億元。
按照產(chǎn)品分類,科大訊飛2023年?duì)I業(yè)收入28.31由教育產(chǎn)品和服務(wù)創(chuàng)造;20.04%由開放平臺(tái)創(chuàng)造;10.67%由運(yùn)營商相關(guān)業(yè)務(wù)創(chuàng)造;9.6%由信息工程創(chuàng)造。
五、發(fā)展趨勢
1.政策支持
人形機(jī)器人是具身智能理想形態(tài)。國家明確人形機(jī)器人戰(zhàn)略意義:“有望成為及計(jì)算機(jī)、智能手機(jī)、新能源汽車后的顛覆性產(chǎn)品,將深刻變革人類生產(chǎn)生活方式,重塑全球產(chǎn)業(yè)發(fā)展格局”國家頂層明確部署了人形機(jī)器人中短期戰(zhàn)略路徑,并通過制定多項(xiàng)關(guān)鍵任務(wù)(技術(shù)、產(chǎn)品、場景、生態(tài)等)清晰引導(dǎo)未來產(chǎn)業(yè)發(fā)展方向。
2.與大模型的結(jié)合
大模型促使智能體從被動(dòng)的編程控制朝著主動(dòng)決策轉(zhuǎn)變。當(dāng)與智能體相結(jié)合后,具身智能以任務(wù)目標(biāo)作為導(dǎo)向,不再只是機(jī)械地執(zhí)行程序。它能夠依據(jù)環(huán)境的變化,對行動(dòng)細(xì)節(jié)進(jìn)行實(shí)時(shí)調(diào)整,從而消除了在特定條件下針對特定任務(wù)反復(fù)編程的必要。憑借大模型的涌現(xiàn)能力,具身智能可以從原始訓(xùn)練數(shù)據(jù)中學(xué)習(xí)并挖掘出新的特征與模式,即便僅僅依靠網(wǎng)絡(luò)數(shù)據(jù)知識(shí),也能夠針對從未見過的對象或場景執(zhí)行操作任務(wù)。
3.功能持續(xù)進(jìn)化
相比于傳統(tǒng)基于AI視覺及特定場景預(yù)訓(xùn)練的機(jī)器人,具身智能的突出特點(diǎn)是:一是不再依賴預(yù)定義的復(fù)雜邏輯來管理場景;二是能形成學(xué)習(xí)進(jìn)化機(jī)制,持續(xù)獲取交互反饋來實(shí)現(xiàn)環(huán)境自適應(yīng);三是能通過身體與環(huán)境交互產(chǎn)生新的交互數(shù)據(jù),并用于實(shí)現(xiàn)智能增長。在這樣的功能加持下,具身智能將能實(shí)現(xiàn)持續(xù)的智能進(jìn)化。