2024 STRATEGY 編者按:短短兩年多時(shí)間,特斯拉已經(jīng)推出第二代人形機(jī)器人Optimus Gen2,身體更輕盈,行走更快速,手指靈巧似真人。馬斯克預(yù)計(jì)這款機(jī)器人最終價(jià)格可能低于2萬美元,3-5年內(nèi)實(shí)現(xiàn)量產(chǎn),產(chǎn)量達(dá)到數(shù)百萬臺,未來市場空間比電動(dòng)車還大。 繼智能手機(jī)、電動(dòng)汽車之后,人形機(jī)器人能否成為下一代爆發(fā)的超級終端?加速過程中,哪些環(huán)節(jié)會遭遇“卡脖子”,哪些環(huán)節(jié)具有高貝塔?以下是先進(jìn)制造二組在本年度策略會上的解析,整理成文,與投資者共饗。 要理解AI對于人形機(jī)器人的作用,首先要引入具身智能的概念,這個(gè)概念最早由圖靈在1950年提出。 舉例來說,要讓一臺機(jī)器去認(rèn)識一個(gè)盒子,如果是傳統(tǒng)的機(jī)器智能,我們需要給這個(gè)機(jī)器輸入很多標(biāo)注好的盒子來進(jìn)行訓(xùn)練,輸入的數(shù)據(jù)越多,機(jī)器識別盒子的能力就越強(qiáng)。依賴外部輸入的方式來提升,這種智能也被稱為“第三人稱”的智能。 而具身智能其實(shí)是“第一人稱”的智能。具備這種智能的機(jī)器人通過打開盒子從而認(rèn)識到,盒子可以裝東西。這和人的學(xué)習(xí)模式相似,就是通過親身感受物理世界,并由此得出經(jīng)驗(yàn)來持續(xù)提升自己。這種第一人稱的智能是持續(xù)進(jìn)化的源泉。 大模型開拓應(yīng)用場景 量產(chǎn)時(shí)代臨近 斯坦福大學(xué)李飛飛教授提出將語言大模型和視覺模型相結(jié)合,來實(shí)現(xiàn)具身智能。實(shí)驗(yàn)中,研究人員給出指令:打開最上面的抽屜,注意花瓶。 大語言模型(LLM)由此拆解指令,將任務(wù)分為三個(gè)步驟:1)抓住最上面的抽屜把手;2)把手向外平移;3)要遠(yuǎn)離花瓶。 然后,視覺語言模型(VLM)開始發(fā)揮作用,分別賦予抽屜手柄(目標(biāo)物)和花瓶周圍(回避區(qū))高值和低值,再把高值區(qū)域作為運(yùn)動(dòng)規(guī)劃的目標(biāo)函數(shù)來生成相應(yīng)的運(yùn)動(dòng)軌跡。 在這個(gè)邏輯下,不需要對每個(gè)任務(wù)訓(xùn)練數(shù)據(jù),而是根據(jù)生成的目標(biāo)函數(shù)自動(dòng)規(guī)劃運(yùn)動(dòng)軌跡,最終能0樣本學(xué)習(xí)的條件下完成目標(biāo)任務(wù)。 谷歌的機(jī)器人團(tuán)隊(duì)將多模態(tài)的大模型植入機(jī)械臂,使之具備了很強(qiáng)的推理能力。比如指令是“把香蕉放在2+1總和的位置”,它就會把香蕉放到編號3的地方。 此外是視覺推理能力,比如指令是“把草莓放到正確的碗當(dāng)中”,雖然沒有解釋什么樣的碗是正確的碗,但是它通過觀察發(fā)現(xiàn)某個(gè)碗里已經(jīng)裝有草莓,于是就推斷出這是正確的碗。由此可見,它的理解能力已經(jīng)和人類的語言常識以及行為常識非常接近了。 在AI研究層面,李飛飛團(tuán)隊(duì)和谷歌都處于領(lǐng)先地位,但是在量產(chǎn)能力上,特斯拉有著明顯的優(yōu)勢。首先是硬件架構(gòu)設(shè)計(jì)的能力,特斯拉引入了直線關(guān)節(jié)來提升人形機(jī)器人的爆發(fā)力,迭代速度也非???。
具身智能本質(zhì)上是一個(gè)擁有物理載體的AI,像人類一樣去感知和理解環(huán)境并完成任務(wù)。
中國人工智能戰(zhàn)略科學(xué)家朱松純提出,具身智能的實(shí)現(xiàn)(感知、決策、執(zhí)行、反饋)涵蓋六個(gè)學(xué)科的知識,融合極為復(fù)雜,而大模型的出現(xiàn)使以上學(xué)科的融合成為可能,AI有望邁入具身智能時(shí)代。
大模型的出現(xiàn)對于人形機(jī)器人的進(jìn)化是關(guān)鍵的一步,使得機(jī)器人未來大概率能夠應(yīng)用到制造業(yè)或者人類生活的各個(gè)場景當(dāng)中。
從目前展示的視頻來看,Optimus已經(jīng)具備了運(yùn)動(dòng)控制、路徑規(guī)劃還有物品操作等能力,而它的短板在于AI層面。但是在2023年7月,特斯拉宣布成立XAI,彌補(bǔ)AI能力的短板。有理由相信,特斯拉入局后,人形機(jī)器人量產(chǎn)的時(shí)代極有可能會很快來臨。
尋找認(rèn)知差,擁抱確定性 人形機(jī)器人的核心環(huán)節(jié)大概率還是整機(jī),因?yàn)槿诵螜C(jī)器人和智能汽車類似,功能的實(shí)現(xiàn)依賴于AI能力,規(guī)模量產(chǎn)也在很大程度上依賴于產(chǎn)業(yè)鏈的降本能力。所以我們認(rèn)為,智能駕駛能力比較強(qiáng)的主機(jī)廠在人形機(jī)器人賽道會有天然的優(yōu)勢。 和智能車對比,人形機(jī)器人的移動(dòng)速度更慢,輕感知重推理,所以感知和決策環(huán)節(jié)比智能車的機(jī)會相對少一些。我們主要關(guān)注增量的運(yùn)動(dòng)執(zhí)行器件、結(jié)構(gòu)件和力學(xué)傳感器等。 運(yùn)動(dòng)控制是人形機(jī)器人產(chǎn)業(yè)鏈中成本占比較高,也是國內(nèi)制造業(yè)擁有成本優(yōu)勢的環(huán)節(jié),其中的核心零部件競爭格局好,市場空間也較大,包括旋轉(zhuǎn)關(guān)節(jié)的減速器、直線關(guān)節(jié)的絲杠、手指關(guān)節(jié)里的空心杯電機(jī)以及電機(jī)磁材等等。結(jié)構(gòu)和功能件方面, 3D打印和復(fù)合材料擁有一定空間。 在概念初期,策略是研究驅(qū)動(dòng),尋找認(rèn)知差。 第一個(gè)案例是減速器。特斯拉最早提出人形機(jī)器人概念時(shí),市場認(rèn)為諧波減速器是非常合適的產(chǎn)品。 2023年出現(xiàn)兩個(gè)變化。一是,年初加州大學(xué)的朱博士提出髖腿部的低速高扭矩電機(jī)+行星減速器的方案(朱博士畢業(yè)后去了特斯拉的機(jī)器人事業(yè)部任職)。二是,國內(nèi)很多創(chuàng)業(yè)公司所設(shè)計(jì)的人形機(jī)器人也采用了行星減速器的方案。 行星減速器的特點(diǎn)是結(jié)構(gòu)簡單,成本較低。市場認(rèn)為基于量產(chǎn)考慮,行星減速器可能取代諧波減速器。 但我們對此保留不同的意見,我們認(rèn)為,諧波減速器大概率依然會是人型機(jī)器人中核心的零部件,原因有三。 第二,諧波減速器雖然售價(jià)高,但結(jié)構(gòu)簡單,由波發(fā)生器、剛輪和柔輪三個(gè)主要部件構(gòu)成。在未來大規(guī)模標(biāo)準(zhǔn)化量產(chǎn)時(shí),降本空間較大,能夠降低和行星減速器的價(jià)格差異。 目前還有一些假設(shè)沒有被市場所驗(yàn)證,例如3D打印和輕量化復(fù)合材料。 其次,人形機(jī)器人在運(yùn)動(dòng)時(shí)可能會有摔倒或者磕碰的場景,對輕型材料的強(qiáng)度要求也明顯高于新能源車。 由此可以推斷,高強(qiáng)度的輕量化材料很可能會應(yīng)用到人形機(jī)器人中,對于該類材料的加工方式,3D打印可能是很好的途徑。 展望2024年,人形機(jī)器人產(chǎn)業(yè)可能會進(jìn)入小批量產(chǎn)的階段。哪些企業(yè)能為主機(jī)廠提供配套、能夠拿到訂單,都是可量化、可驗(yàn)證的,很多潛在的推測都會被證偽,核心零部件的確定性在一定程度上則會增強(qiáng),包括運(yùn)動(dòng)控制領(lǐng)域的減速器、絲杠等。
人形機(jī)器人產(chǎn)業(yè)發(fā)展至今分為兩個(gè)階段,一個(gè)是概念初期,二是量產(chǎn)前夕。
首先,人形機(jī)器人產(chǎn)業(yè)鏈的核心玩家是特斯拉,按照規(guī)劃,特斯拉機(jī)器人的第一個(gè)應(yīng)用場景是自己的制造工廠。用在工廠端,機(jī)器人對于輸出扭矩和運(yùn)動(dòng)精度有較高的要求。從該角度出發(fā),行星減速器并不合適,因?yàn)槠渚让黠@低于諧波減速器。
第三,諧波減速器在結(jié)構(gòu)上有很多創(chuàng)新空間,產(chǎn)業(yè)鏈內(nèi)企業(yè)在積極地配合主機(jī)廠做結(jié)構(gòu)的創(chuàng)新,能更好滿足人型機(jī)器人的需求。
第二個(gè)案例是稀土磁材。電動(dòng)車輛已經(jīng)大量使用稀土磁材,以特斯拉的Model3車型為例,電機(jī)總功率194KW,使用的稀土磁材約1.5到2.0公斤。
人形機(jī)器人對于電機(jī)的功率密度的要求更高,而且在結(jié)構(gòu)設(shè)計(jì)上做了很多創(chuàng)新,轉(zhuǎn)子生產(chǎn)工藝更加復(fù)雜,磁材用量及轉(zhuǎn)子模組價(jià)值量得到大幅提升。
首先,人形機(jī)器人對輕量化的需求遠(yuǎn)高于新能源汽車,人形機(jī)器人在運(yùn)動(dòng)時(shí)克服重力勢能,而新能源車是克服滾動(dòng)摩擦。所以從節(jié)能、運(yùn)動(dòng)穩(wěn)定性角度,人形機(jī)器人對輕量化的需求遠(yuǎn)大于新能源車。
產(chǎn)業(yè)界已經(jīng)有企業(yè)和研究機(jī)構(gòu)將3D打印技術(shù)應(yīng)用到人形機(jī)器人。Poppy機(jī)器人全身通過3D打印技術(shù)完成,生產(chǎn)成本相比于傳統(tǒng)機(jī)器人降低了1/3,而且結(jié)構(gòu)更加復(fù)雜,甚至可以模仿人的脊柱關(guān)節(jié)特征。上海交通大學(xué)也使用3D打印技術(shù)制作了微型六足仿生機(jī)器人,體積小,結(jié)構(gòu)復(fù)雜。這些案例都表明3D打印在機(jī)器人領(lǐng)域大概率會有非常好的應(yīng)用前景。
數(shù)據(jù)來源:上海交通大學(xué)、特斯拉AI DAY、谷歌機(jī)器人、voxposer、《Design of a Highly Dynamic Humanoid Robot》 注:本文件非基金宣傳推介材料,僅作為本公司旗下基金的客戶服務(wù)事項(xiàng)之一。 本文件所提供之任何信息僅供閱讀者參考,既不構(gòu)成未來本公司管理之基金進(jìn)行投資決策之必然依據(jù),亦不構(gòu)成對閱讀者或投資者的任何實(shí)質(zhì)性投資建議或承諾。本公司并不保證本文件所載文字及數(shù)據(jù)的準(zhǔn)確性及完整性,也不對因此導(dǎo)致的任何第三方投資后果承擔(dān)法律責(zé)任。基金有風(fēng)險(xiǎn),投資需謹(jǐn)慎。 本文所載的意見僅為本文出具日的觀點(diǎn)和判斷,在不同時(shí)期,朱雀基金可能會發(fā)出與本文所載不一致的意見。本文未經(jīng)朱雀基金書面許可任何機(jī)構(gòu)和個(gè)人不得以任何形式轉(zhuǎn)發(fā)、翻版、復(fù)制、刊登、發(fā)表或引用。