
在互聯(lián)網(wǎng)剛剛興起的時(shí)候,圈內(nèi)流傳著一條法則:“所有”的行業(yè)都值得重做一遍。如今,ChatGPT火爆全球,大家開始思考,X+AI等于什么?
機(jī)器人產(chǎn)業(yè)率先迭代,爭相推出大模型加持的人形機(jī)器人。除了波士頓動(dòng)力等老牌機(jī)器人企業(yè),新能源車企、互聯(lián)網(wǎng)大廠是這次競賽中的新玩家,有人躬身入局自研產(chǎn)品,有人不惜重金大舉投資。
今年2月,華為天才少年“稚暉君”離職創(chuàng)辦智元機(jī)器人,不到半年就獲得三輪融資,市場估值在十幾億美元。美國人形機(jī)器人創(chuàng)業(yè)公司Figure也在兩個(gè)月內(nèi)完成了兩輪融資,炙手可熱。
高盛預(yù)測,在技術(shù)得到革命性突破的理想情況下,人形機(jī)器人2025-2035年銷量CAGR可達(dá)94%,2035年市場規(guī)模達(dá)1540億美元。
馬斯克放言,Optimus最終價(jià)格可能低于2萬美元,預(yù)計(jì)3-5年內(nèi)量產(chǎn),產(chǎn)量達(dá)到數(shù)百萬臺(tái)。一旦產(chǎn)品成熟,量產(chǎn)數(shù)量將達(dá)到100億-200億臺(tái)——超過了地球人口的數(shù)倍,市場空間將超越電動(dòng)車。
中國官方給出發(fā)展目標(biāo),到2027 年,人形機(jī)器人技術(shù)創(chuàng)新能力顯著提升,形成安全可靠的產(chǎn)業(yè)鏈供應(yīng)鏈體系,構(gòu)建具有國際競爭力的產(chǎn)業(yè)生態(tài),綜合實(shí)力達(dá)到世界先進(jìn)水平。
目光所至,金錢追隨,股市概念板塊輪番上漲。繼智能手機(jī)、電動(dòng)汽車之后,人形機(jī)器人能否成為下一代爆發(fā)的超級(jí)終端?加速過程中,哪些環(huán)節(jié)會(huì)遭遇“卡脖子”,哪些環(huán)節(jié)具有高貝塔?
大模型重新定義AI
機(jī)器人稱不上是新興產(chǎn)業(yè),從1927年美國西屋造出第一個(gè)機(jī)器人Televox,學(xué)界和產(chǎn)業(yè)界就開始了深入的研究,目標(biāo)是讓機(jī)器人“像人一樣行動(dòng)和思考”。
2016年,Google旗下Deep Mind開發(fā)的AlphaGo擊敗了人類棋手李世石,成為第一個(gè)戰(zhàn)勝圍棋世界冠軍的機(jī)器人。李世石表示:“在圍棋 AI 出現(xiàn)以后,我發(fā)覺即使自己成為第一名,也永遠(yuǎn)需要面對(duì)一個(gè)不可戰(zhàn)勝的實(shí)體?!?/p>
同年登場的波士頓動(dòng)力Atlas,踉踉蹌蹌地在碎石和雪地里行走,形似醉漢。然而短短幾年的時(shí)間里,Atlas的運(yùn)動(dòng)能力突飛猛進(jìn),不僅能夠流暢地奔跑,還學(xué)會(huì)了倒立和跳馬、跳舞和跑酷,每次發(fā)布新視頻,都能刷屏收獲一片驚嘆。
機(jī)器人在智慧和運(yùn)動(dòng)上展現(xiàn)的能力,已經(jīng)超越人類的想象,但是人們期待的顛覆并沒有發(fā)生——在不同行業(yè)、不同場景之間,復(fù)制AI能力的難度和成本都太高了。
在傳統(tǒng)的深度學(xué)習(xí)模型中,人類需要投喂大量的“問題和答案”給機(jī)器去學(xué)習(xí),機(jī)器在此基礎(chǔ)上總結(jié)出方法論,再來解決類似的問題。一旦介入新的場景,就必須從頭開始,收集數(shù)據(jù)、訓(xùn)練模型。這種“第三人稱”的機(jī)器智能往往局限于特定場景,很難觸類旁通。
而在大模型的加持下,機(jī)器能夠與真實(shí)世界進(jìn)行多模態(tài)交互,像人類一樣感知和理解環(huán)境,并通過自主學(xué)習(xí)來完成復(fù)雜任務(wù)。由此,機(jī)器智能走向了第一人稱的“具身智能”,擁有持續(xù)進(jìn)化、跨場景應(yīng)用的能力。

大模型接入機(jī)器人,無須額外數(shù)據(jù)和訓(xùn)練,將指令付諸行動(dòng),斯坦福大學(xué)李飛飛團(tuán)隊(duì)已經(jīng)給出了成功案例VoxPoser。
實(shí)驗(yàn)中,研究人員給出指令:打開最上面的抽屜,注意花瓶。
大語言模型(LLM)由此作出推斷:1)抓住最上面的抽屜把手;2)把手向外平移;3)要遠(yuǎn)離花瓶。
然后,在視覺語言模型(VLM)的指引下,從未經(jīng)過培訓(xùn)的機(jī)器人繞過了障礙,打開了抽屜。這項(xiàng)技能不限于特定任務(wù),開瓶子、按開關(guān)、拔充電線都能完成。
基于LLM+VLM的具身智能實(shí)踐

在更多的實(shí)驗(yàn)中,VoxPoser還展現(xiàn)出超強(qiáng)的認(rèn)知和推理能力:
首先是估計(jì)物理特性。給定一個(gè)滑板,兩個(gè)滑塊,直接提問“哪個(gè)更重”,于是機(jī)器人將兩個(gè)滑塊往下推,發(fā)現(xiàn)其中一個(gè)滑得更快更遠(yuǎn),由此推理出這塊更重。
第二是行為常識(shí)推理。告訴機(jī)器人“我是左撇子”,同時(shí)讓它遞送一個(gè)工具,那么它就會(huì)自動(dòng)地把工具放到你的左手邊。
第三是細(xì)粒度語言校正。對(duì)于需要高精度的任務(wù),例如“用蓋子蓋住茶壺”,向機(jī)器人發(fā)出指令“你偏離了1cm”,它就會(huì)自動(dòng)糾正。
第四是多步可視化程序。給定一個(gè)任務(wù)“將抽屜打開一半”,而機(jī)器人從來沒有打開過這個(gè)抽屜,也不清楚一半的位置是哪里,但它卻知道先把抽屜全部打開,再合上一半。
大模型重新定義了AI,也刷新了研究機(jī)構(gòu)的認(rèn)知。深耕機(jī)器人多年的Deep Mind承認(rèn),“由于大模型的出現(xiàn),我們不得不重新考慮整個(gè)研究項(xiàng)目,之前研究的很多東西已完全失效?!?/p>
于是Deep Mind猛拉進(jìn)度條,耗時(shí)7個(gè)月就發(fā)布了新一代機(jī)器人RT-2,將多模態(tài)大模型“塞進(jìn)”機(jī)械臂,使得機(jī)器人能夠理解包含數(shù)學(xué)邏輯推理的命令,比如“將香蕉放到2+1的總和的位置”,也能歸類水果,“把草莓放到正確的碗里”。
集成電路上可容納的元器件的數(shù)目,每隔 18-24 個(gè)月便會(huì)增加一倍,性能也將提升一倍,被稱作“摩爾定律”。OpenAI報(bào)告顯示,近年來人工智能訓(xùn)練任務(wù)所需求的算力每 3.43 個(gè)月就會(huì)翻倍,速度遠(yuǎn)超半導(dǎo)體行業(yè)的摩爾定律。
隨著海量數(shù)據(jù)的積累、算力的提升與算法的突破,大模型參數(shù)規(guī)模大概率將呈現(xiàn)指數(shù)級(jí)增長。當(dāng)模型足夠大、數(shù)據(jù)足夠多的時(shí)候,甚至可能跨越“奇點(diǎn)”,涌現(xiàn)出全新的智能。
然而,與商業(yè)模式清晰的AIGC不同,人形機(jī)器人要從實(shí)驗(yàn)室走向市場,還受制于高昂的成本。
2018年,本田宣布停止人形機(jī)器人Asimo的研發(fā),轉(zhuǎn)向研發(fā)更具實(shí)用性的案例,比如專業(yè)護(hù)理、道路交通等領(lǐng)域的機(jī)器人。2000 年以來,Asimo已經(jīng)發(fā)布了七代機(jī)型,一度代表世界領(lǐng)先水平,但因?yàn)榧夹g(shù)復(fù)雜、造價(jià)高達(dá)250萬美元,始終未能實(shí)現(xiàn)量產(chǎn)。
同樣造價(jià)的Atlas則活成了全民網(wǎng)紅,精彩炫技無人買單。定價(jià)7.45萬美元的機(jī)器狗Spot于2020年登上貨架,當(dāng)年官方公布的銷售量(租借和出售)大約是250個(gè),其后便沒有更新數(shù)據(jù)。七年時(shí)間里,波士頓動(dòng)力三易其主,從谷歌到軟銀再到現(xiàn)代汽車。
站在時(shí)代的分水嶺上,后來者無疑是幸運(yùn)的。大模型的突破將為人形機(jī)器人開拓更多應(yīng)用場景,催生新的需求,引發(fā)規(guī)模效應(yīng)實(shí)現(xiàn)降本,從而打開更大的市場,并促使企業(yè)研發(fā)更加先進(jìn)的智能技術(shù),形成技術(shù)-應(yīng)用-成本的飛輪效應(yīng)。
在這場激烈的角逐中,快速集齊智能技術(shù)、成熟供應(yīng)鏈和應(yīng)用場景三塊拼圖的玩家,有可能最先啟動(dòng)飛輪。
擎天柱的秘密武器
2021年的AI Day上,特斯拉人形機(jī)器人的概念圖首次發(fā)布。
一年后,Optimus就以原型機(jī)真身示人,關(guān)節(jié)、骨骼、電纜等設(shè)備清晰可見,在現(xiàn)場行走揮手。而在演示視頻里,它已經(jīng)可以做一些簡單的工作,比如在工廠搬運(yùn)箱子、在辦公室澆花。
今年10月的最新亮相中,Optimus已經(jīng)學(xué)會(huì)了分揀不同顏色的積木,在人為打亂的情況下也能有序分類,并把顛倒的積木擺正。除此之外,還能平穩(wěn)地完成單腿支撐的瑜伽動(dòng)作。短短三年時(shí)間,Optimus在感知、大腦、運(yùn)動(dòng)與控制方面都進(jìn)步神速。
不過,和“體育生”Atlas相比,Optimus顯得平平無奇。但是很多人沒有注意到,Atlas沒有手指,只能完成開門、抓握等大動(dòng)作,拿、捏、舉、拉這些動(dòng)作就超綱了。而Optimus卻能像人手一樣完成復(fù)雜靈巧的工作,并承擔(dān)大約9公斤的負(fù)重。
更重要的是,Optimus實(shí)現(xiàn)了端到端的神經(jīng)網(wǎng)絡(luò)控制:僅僅通過視覺輸入,就可以控制各個(gè)部件的動(dòng)作,省去了一系列手動(dòng)設(shè)計(jì)的中間步驟和特征提取過程。這就使得機(jī)器人具備自主學(xué)習(xí)能力,快速適應(yīng)不同的環(huán)境。
看似后來居上,其實(shí)蓄謀已久。馬斯克早就說過:“特斯拉可以說是全球‘最大’的機(jī)器人公司,因?yàn)槲覀兊钠嚲拖褫喿由系陌敫兄獧C(jī)器人。”O(jiān)ptimus(擎天柱)的秘密就藏在名字里,如同變形金剛一樣從四輪汽車人變身為雙足機(jī)器人。
在核心的大腦部分,Optimus采用了與特斯拉電動(dòng)車相同的全自動(dòng)駕駛系統(tǒng)FSD和感知計(jì)算單元,以及自主研發(fā)的Dojo D1超級(jí)計(jì)算機(jī)芯片以及三顆Autopilot級(jí)別自動(dòng)輔助攝像頭。
在智能駕駛中,F(xiàn)SD算法利用傳感器數(shù)據(jù)感知環(huán)境,并以此進(jìn)行路徑規(guī)劃和決策。根據(jù)去年AI Day公布的數(shù)據(jù),特斯拉已經(jīng)積累 480 萬段數(shù)據(jù),訓(xùn)練 7.5 萬個(gè)神經(jīng)網(wǎng)絡(luò),每 8 分鐘就要出一個(gè)新的模型,共有 281 個(gè)模型用到了特斯拉的車上,在此基礎(chǔ)上已推出 35 個(gè) FSD 更新版本。
而Dojo是人工智能的訓(xùn)練“道場”,將數(shù)百萬輛汽車采集到的現(xiàn)實(shí)世界數(shù)據(jù)傳輸?shù)匠阆到y(tǒng),通過運(yùn)算和分析,推動(dòng)智能進(jìn)化。以往特斯拉主要依靠英偉達(dá)的GPU構(gòu)建訓(xùn)練機(jī),每年需要支付數(shù)億美金。自研芯片D1的誕生,不僅省下一大筆開支,更攻克了算力的“卡脖子”環(huán)節(jié)。
Optimus完美承接了車端的資源積累,并將受益于規(guī)模效應(yīng),大幅降低成本。不過,要實(shí)現(xiàn)具身智能,多模態(tài)的AI能力還有待提升。今年7月份馬斯克宣布成立xAI,進(jìn)軍AGI,向微軟、谷歌等巨頭發(fā)出戰(zhàn)書。
最近OpenAI董事會(huì)罷免創(chuàng)始人Sam Altman,引發(fā)700多名員工聯(lián)名抗議:“OpenAI is nothing without its people”。一波三折之后,Altman回歸并組建了新的董事會(huì)。在此期間,英偉達(dá)公開喊話,意圖挖人。DeepMind據(jù)傳已經(jīng)收到來自O(shè)penAI員工的簡歷。AGI人才之戰(zhàn),一觸即發(fā)。
AI決定了機(jī)器人產(chǎn)品力的天花板,而硬件決定產(chǎn)品的落地程度。

與汽車不同的是,機(jī)器人要求更高的靈活度、精準(zhǔn)度和穩(wěn)定性,需要幾十個(gè)關(guān)節(jié)完美配合,才能完成復(fù)雜動(dòng)作。這是硬件中價(jià)值量較大的一塊,也蘊(yùn)藏著新技術(shù)方向的機(jī)會(huì)。
Optimus全身上下有40 個(gè)關(guān)節(jié)執(zhí)行器,其中旋轉(zhuǎn)關(guān)節(jié)14個(gè),用在肩膀、手腕、腰、髖四個(gè)旋轉(zhuǎn)部位。直線關(guān)節(jié)14個(gè),用在手肘、手腕、髖、膝、腳踝5個(gè)部位,模擬人肌肉組織,提供強(qiáng)大的直線拉力。去年的AI Day上,單個(gè)線性執(zhí)行器能拉起一臺(tái)半噸重的音樂會(huì)三角鋼琴。手指關(guān)節(jié)12個(gè),其中大拇指處使用2套,使得拇指和手掌都能像人手一樣彎曲。
旋轉(zhuǎn)關(guān)節(jié)主要由諧波減速器和電機(jī)構(gòu)成,也包括編碼器、角接觸軸承、力矩傳感器等。據(jù)我們市場調(diào)研顯示,樣件價(jià)格單套旋轉(zhuǎn)關(guān)節(jié)價(jià)值量2400-4100元,按照批量供應(yīng)價(jià)格來計(jì)算,14套的價(jià)值量在2-3萬之間。其中諧波減速器價(jià)值量最高,單臺(tái)1000-2000元。
諧波減速器是眾多減速器類型中的一種,具有傳動(dòng)比高、質(zhì)量體積小、齒隙小可反向傳動(dòng)等優(yōu)勢(shì),缺點(diǎn)是剛度低,主要應(yīng)用在機(jī)器人輕載位置。另一種RV減速器抗沖擊能力更強(qiáng),傳動(dòng)效率也高,但是結(jié)構(gòu)復(fù)雜、質(zhì)量體積大,更多應(yīng)用在工業(yè)機(jī)器人領(lǐng)域,做一些高負(fù)載的運(yùn)動(dòng)。經(jīng)過多年的技術(shù)研發(fā),中國制造已經(jīng)打破了國際龍頭的壟斷,實(shí)現(xiàn)了國產(chǎn)諧波減速器的規(guī)?;瘧?yīng)用。

來源:招商證券
直線關(guān)節(jié)主要由電機(jī)和行星滾珠絲杠構(gòu)成,也包括點(diǎn)接觸軸承、深溝球軸承、力矩傳感器等,據(jù)我們市場調(diào)研顯示,樣件價(jià)格單套直線關(guān)節(jié)價(jià)值量3700-5000元,14套的價(jià)值量也在2-3萬區(qū)間。其中行星滾珠絲杠價(jià)值量最高,單臺(tái)約3000元。
在工業(yè)領(lǐng)域主要有三種絲杠,第一種是梯形螺紋絲杠,其實(shí)就是一個(gè)螺母套在螺桿上面。第二種叫做滾珠絲杠,在螺母和螺桿之間加了一些小鋼珠,降低摩擦阻力,提升傳動(dòng)扭距。第三種就是行星滾柱絲杠,在螺母和螺桿之間,用滾柱取代滾珠,由點(diǎn)接觸變?yōu)榫€接觸,因此可承載的力矩、最高轉(zhuǎn)速均有明顯提升。

以往很少有高精尖的設(shè)備會(huì)用到行星滾柱絲杠,因此市場空間非常小,國內(nèi)企業(yè)鮮有布局。人形機(jī)器人的需求興起后,那些具有強(qiáng)大技術(shù)積累和資源能力的企業(yè),有望在市場擴(kuò)容中占據(jù)領(lǐng)先份額。
手指關(guān)節(jié)由于空間非常有限,運(yùn)用了一種特殊的電機(jī),叫空心杯電機(jī)。相比傳統(tǒng)直流電機(jī),空心杯電機(jī)用銅線圈取代了鐵芯轉(zhuǎn)子,優(yōu)勢(shì)在于無鐵損傳動(dòng)效率高、體積小、功率密度高、可控性高、噪音低,之前主要應(yīng)用于航空航天和醫(yī)療領(lǐng)域。海外三巨頭占據(jù)了全球的主要份額,國內(nèi)企業(yè)通過海外收購也在加速追趕,包括研發(fā)繞線技術(shù)。
此外,出于節(jié)能和穩(wěn)定性的需求,雙足機(jī)器人還需要克服重力勢(shì)能,采用輕量化的新型材料,包括鎂合金、鈦合金、碳纖維材料等等。
據(jù)開源證券統(tǒng)計(jì),Optimus的硬件成本超過一半,要達(dá)到 2 萬美金售價(jià)還有84%的降價(jià)空間。在新能源汽車迅速崛起的浪潮中,國內(nèi)供應(yīng)鏈企業(yè)在技術(shù)研發(fā)、響應(yīng)效率和差異化降本方面已經(jīng)顯露出優(yōu)勢(shì),甚至誕生出世界領(lǐng)軍的企業(yè)。人形機(jī)器人的科技浪潮中,我們期待新的黑馬涌現(xiàn)。
Optimus投入使用的第一站,將會(huì)是特斯拉的超級(jí)工廠。加州、上海、德州、柏林、墨西哥五大超級(jí)工廠共有12.8萬名員工,假設(shè)只是取代其中部分人力,也能創(chuàng)造數(shù)量可觀的需求,開啟產(chǎn)業(yè)化落地的進(jìn)程。
當(dāng)雇傭一個(gè)人形機(jī)器人的成本與同等勞動(dòng)力的人類收入相當(dāng)時(shí),機(jī)器人將真正改變社會(huì)的生產(chǎn)力結(jié)構(gòu),走進(jìn)各行各業(yè)與千家萬戶。這不只是萬億級(jí)的增量市場,更是一個(gè)充滿無限可能的新紀(jì)元。
朱雀基金年度策略會(huì)將于12月15日在上海召開,將圍繞“能源革命”“智能時(shí)代”“內(nèi)需驅(qū)動(dòng)”三大權(quán)益聚焦方向以及固收、量化等多元資產(chǎn)展開討論。如有想要了解的問題,歡迎留言。
本文件非基金宣傳推介材料,僅作為本公司旗下基金的客戶服務(wù)事項(xiàng)之一。
本文件所提供之任何信息僅供閱讀者參考,既不構(gòu)成未來本公司管理之基金進(jìn)行投資決策之必然依據(jù),亦不構(gòu)成對(duì)閱讀者或投資者的任何實(shí)質(zhì)性投資建議或承諾。本公司并不保證本文件所載文字及數(shù)據(jù)的準(zhǔn)確性及完整性,也不對(duì)因此導(dǎo)致的任何第三方投資后果承擔(dān)法律責(zé)任?;鹩酗L(fēng)險(xiǎn),投資需謹(jǐn)慎。
本文所載的意見僅為本文出具日的觀點(diǎn)和判斷,在不同時(shí)期,朱雀基金可能會(huì)發(fā)出與本文所載不一致的意見。本文未經(jīng)朱雀基金書面許可任何機(jī)構(gòu)和個(gè)人不得以任何形式轉(zhuǎn)發(fā)、翻版、復(fù)制、刊登、發(fā)表或引用。