文丨《瞭望東方周刊》記者萬宏蕾 原文標題:當AI“煉”成人形,能為人類做些什么?
完整、逼真的“人形”身體,因對人類有獨特的親和力、有望實現復雜功能等特性,被視為AI的一種理想載體,甚至“終極形態”。
7月4日,在2024世界人工智能大會拍攝的“十八金剛 眾創未來——人形機器人先鋒陣列”( 王翔/攝)
8月21-25日,在北京舉行的2024世界機器人大會上,27款國產人形機器人引發廣泛關注。“他們”在大會現場演奏揚琴、潑墨揮毫、比球賽、打辯論、跳“科目三”,賺足了流量。
7月4日,在上海開幕的2024世界人工智能大會(WAIC)上,由15款、18臺人形機器人組成的“十八金剛”陣列,向現場觀眾做出整齊的動作,分外吸睛。國家地方共建人形機器人創新中心的“青龍”、智元機器人的遠征A2、宇樹科技的Unitree H1、傅利葉的GR-1、達闥的雙足XR4等國產具身機器人產品紛紛亮相。
7月6日,在2024世界人工智能大會上,人們觀看宇樹科技通用人形機器人Unitree H1表演“科目三”舞蹈(王翔/攝)
“具身智能是人工智能發展的下一個浪潮。”中國工程院院士、清華大學信息學院院長、北京信息科學與技術國家研究中心主任、中國人工智能學會理事長戴瓊海說。
所謂“具身智能”,就是給能理解、推理并與物理世界互動的AI“頭腦”再加上一個“身體”,“身體”可以是手機、汽車、機床、機械臂等等,而完整、逼真的“人形”身體,因對人類有獨特的親和力、有望實現復雜功能等特性,被視為AI的一種理想載體,甚至“終極形態”。這兩年,在大模型高速發展帶動下,人形機器人產業迎來風口,成為全球科技業最熱的賽道之一。
2024年8月,美國具身智能公司Figure AI發布二代人形機器人Figure02。此前,Figure 01已進入寶馬工廠工作。國內,優必選的人形機器人Walker S先后走進比亞迪、蔚來、東風柳汽、極氪等汽車工廠“打工”,智元機器人的人形機器人遠征A1也在汽車工廠完成底盤裝配和外觀質檢等任務……
“AI大模型將賦能人形機器人走向主動交互,成為繼計算機、智能手機、新能源汽車后的顛覆性產品。”8月13日,十四屆全國政協常委、工業和信息化部原副部長、中國電子學會理事長徐曉蘭在2024世界機器人大會新聞發布會上說。
越來越“像”人
在位于上海浦東張江科學城的國家地方共建人形機器人創新中心(以下簡稱“國地中心”)內,身高185厘米、體重80公斤,擁有多達43個主動自由度的人形機器人“青龍”雙臂輕展,用五根鋼鐵手指,將面包輕輕捏起。
全球首款全尺寸通用人形機器人開源公版機——“青龍”機器人正在展示(萬宏蕾/攝)
“‘青龍’具有五感能力:能看,能聞,能聽,有觸覺,還有姿態傳感器。它雙手非常靈活,能精準抓取兩厘米的小物件,能用工具在小米里挑出芝麻。”國地中心總經理許彬告訴《瞭望東方周刊》,“‘青龍’機器人平臺的核心技術前期經過了十余年的沉淀。從國地中心成立到最近在世界人工智能大會上整機亮相,我們團隊在短短半年時間內,厚積薄發,從無到有,實現了突破。”
“端水、抓取,聽起來簡單,做起來復雜,涉及從感知、決策到控制的多項技術。”國地中心首席科學家江磊說,“‘青龍’一條手臂有7個自由度、末端手指有6個自由度,指尖有觸覺傳感器,因此可以完成對抓取的自主判斷。”
“對人形機器人來說,大腦對應智能系統,小腦對應控制系統,五官對應機器人的感知,執行則通過關節進行。”上海機器人產業技術研究院副院長周梅杰說。
“‘青龍’之所以聰明,在于機器人和大模型的深度融合,負責人機交互和決策的‘大腦’(朱雀具身大腦大模型)、負責穩定行走的‘小腦’(玄武小腦模型),共同形成人形機器人的技術基座。”江磊介紹說,朱雀具身大腦如同一個智能化指揮調度中心,以多模態大模型為核心,能夠接收文字信息、圖像信息等多種輸入,并輸出精準的語音交互以及明智的任務決策信息;玄武小腦模型側重于任務執行,其軌跡規劃模塊采用“端到端”模仿學習驅動的方式。
“在大數據、大模型和大算力的支持下,人形機器人正在變得越來越聰慧,逐漸具備自主完成任務的能力。”徐曉蘭說。
機器人產業已發展多年,過去的機器人一般只側重一個“技能點”,“寫一段代碼做一件事”。比如:一些工業機器人,主要比“肌肉”,側重發展運動控制技術;掃地機器人是否好用,取決于能否規避障礙,把屋子打掃干凈,主要側重發展導航傳感技術。而人形機器人,要和人一樣有“知行合一”的綜合能力,就要在芯片、傳感器、軟件、人工智能、通信、機械、材料等諸多前沿技術以及綜合應用上實現突破。
“在此輪發展大模型之前,在機器人‘大腦’層面,技術上幾乎沒有什么水花,各家推出的模型,基本都只能實現簡單任務。這兩年,相關技術迎來質變的拐點。”許彬說,“未來,隨著人形機器人高速‘成長’,其心智或許很快會脫離稚嫩,邁向‘成年人’的賽道。”
“深度學習讓人工智能對世界有了感知,大模型則讓人工智能有了自主生成的決策能力。”北京新鼎榮盛資本管理有限公司董事長、創始合伙人張弛說,“不遠的未來,人形機器人將走向通用和商業化”。
多城市布局
“人形機器人正在成為科技競爭的新高地、未來產業的新賽道,蘊藏巨大的市場空間和發展機遇。”徐曉蘭在2024世界機器人大會新聞發布會上表示。
早在2021年,“十四五”規劃綱要就將機器人產業提到了重要位置。由工業和信息化部、國家發展改革委等十五部門發布的《“十四五”機器人產業發展規劃》提出,到2025年,中國要成為全球機器人技術創新策源地、高端制造集聚地和集成應用新高地。
2023年,隨著AI大模型技術加速迭代,“人形機器人”作為熱詞頻繁出現在國家和相關部委文件中。當年10月,工業和信息化部印發的《人形機器人創新發展指導意見》提出,到2025年,我國人形機器人創新體系初步建立;到2027年,人形機器人技術創新能力顯著提升,綜合實力達到世界先進水平。
以政策為牽引,各省市圍繞著人形機器人產業的布局加速展開。
2023年4月,杭州提出,力爭到2026年實現智能機器人全產業鏈工業產值突破500億元。
2023年5月,上海印發《上海市推動制造業高質量發展三年行動計劃(2023-2025年)》,特別提到加快人形機器人創新發展。同時,上海在全球投資促進大會現場發布2024“投資上海”政策包,其中最引人關注的就是千億母基金。該母基金由上海市國資委推動設立,圍繞集成電路、生物醫藥、人工智能三大先導產業,重點投向集成電路、創新藥、智能機器人等領域。
同期,深圳印發《深圳市加快推動人工智能高質量發展高水平應用行動方案(2023-2024年)》,明確提出發展人形機器人。
2023年6月,北京印發《北京市機器人產業創新發展行動方案(2023-2025年)》,針對人形機器人行業進行政策指導,提出加緊布局人形機器人。
多地發展人形機器人的戰略圖景中出現了一個新角色——人形機器人創新中心。“創新中心本質上承擔著調動當地資源,促進當地人形機器人產業發展的責任。”許彬說。
2023年5月在上海揭牌的國地中心,是人形機器人領域首個國家級公共平臺。“當時,為了國地中心選址,我們考察了好幾個城市。”許彬回憶說,“人形機器人很多技術基礎和工業機器人、新能源汽車的產業鏈是共通的,上海在這些領域產業基礎雄厚。出于產業基礎、政策環境等綜合考慮,落戶上海是優選。”
“國地中心核心任務之一就是加速機器人通用場景的落地。”許彬辦公桌對面的白板上,密密麻麻手寫著其對創新中心組織架構的思考。“2024年,我們計劃在上海打造能容納 100臺人形機器人的訓練場。我們先選擇相對簡單的、方便實施的場景來落地,推動人形機器人產業技術創新,并帶動通用場景的落地。”
所謂“訓練場”,就是數據生產和數據規模化場地。這里會建設實時標定系統、控制系統、數據采集系統和數據反饋系統,通過數字孿生來生成合成式數據,為人形機器人產業打造真實和生成式數據。
作為技術領域廣泛、生產工藝復雜的實體產業,人形機器人涉及數千乃至上萬個零部件的細分產業。發展人形機器人,對直接創造產值、帶動就業、引領產業鏈發展,都具有重要意義。“這也是多地積極籌建人形機器人創新中心,大力推動人形機器人產業發展的原因之一。”許彬說。
目前,北京、上海、寧波、合肥、成都等城市均已建設人形機器人創新中心,在人形機器人賽道上搶先發力。
產業化在即
企查查數據顯示,目前我國機器人相關企業主要集中在深圳、廣州、上海和蘇州,這四個城市分別擁有4.94萬、4.41萬、3.61萬和3.52萬家相關企業。人形機器人最關鍵的核心零部件頭部供應商及供應鏈企業,主要分布在長三角和珠三角。
產業發展離不開資本投入,伴隨人形機器人迎著風口“起飛”,VC(風險投資)、PE(私募股權投資)前仆后繼地涌入這條頗具科幻感的賽道。
2024年8月18日,被譽為“天才少年”的智元機器人聯合創始人彭志輝一口氣發布五款商用人形機器人新品,分別為“遠征”和“靈犀”系列。同時,彭志輝宣布智元機器人啟動一系列開源計劃:包括具身智能機器人訓練所需的百萬條真機數據集和千萬條仿真數據集。
“我們希望通過數據開源、提供零部件,讓更多人利用智元的零部件,快速掌握人形機器人技術。”智元機器人合伙人兼營銷服務副總裁姜青松說。
一年前的2023年8月,智元機器人發布第一代通用型具身智能機器人——遠征A1,并把2024年定義為智元機器人“商用元年”。該公司預測,2024年發貨量為300臺,其中雙足機器人200臺,輪式機器人100臺,主要用于交付服務場景和工業場景。
作為行業內的明星企業,智元機器人融資迅猛。目前,該公司已完成天使輪、A輪、A1輪、A1+輪、A2輪等多輪融資,A系列融資多達6輪。
2024年2月,宇樹科技宣布完成B++輪融資,投資方包括美團、金石投資、源碼資本,老股東深創投、中網投、容億、敦鴻和米達鈞石跟投,融資近10億元。
把時間軸拉長,可以看到達闥機器人、傅利葉智能、樂森機器人等相關創業公司身后都擠滿了投資機構。據統計,2024年上半年相關融資總額超過70億元。
市場前景方面,據國際投資銀行高盛預測,到2035年,人形機器人市場規模有望達到1540億美元(約合人民幣11037億元)。
另據2024年4月首屆中國人形機器人產業大會上發布的《人形機器人產業研究報告》預測,2024年中國人形機器人市場規模將達約27億元,2026年達104億元,2029年達750億元,占彼時世界總量的32.7%,位居世界第一,到2035年有望達到3000億元規模。通過在“智慧大腦”的深度學習、“敏捷小腦”的精準控制、“強健肢體”的創新設計上取得關鍵性突破,人形機器人產業將加速從“樣機炫技”走向商業化應用的落地。
“人形機器人是人工智能技術與制造業場景深度融合的載體,中國人形機器人產業正處于井噴前夜。”徐曉蘭作出這樣的判斷。
開源新生態
2024世界人工智能大會上,國地中心正式發布“青龍”為全球首款全尺寸通用人形機器人開源公版機。
“每年我們團隊會更新一版公版機,大家拿到我們的設計參考,能有的放矢地進行很多人形機器人方面的創新。”許彬介紹,作為全球首款全尺寸通用人形機器人,“青龍”集成了43個主動自由度,實現了頭部、手部、臂部、腿部、腰部、踝部的全尺寸設計。“借鑒科學界和技術界在技術分享與開源創新方面的經驗和做法,經過評估,我們對‘青龍’設計圖紙、軟件代碼和數據集進行開源,旨在吸引全球范圍內的開發者、研究者和企業家共同參與人形機器人的研發和應用,加速人形機器人技術的普及和產業化進程。”
“我們有一個共同想法,要打造中國人形機器人的底座技術。”江磊說,開源不僅能夠匯聚全球智慧,加速技術創新,還能為中國科技在國際舞臺上贏得更多話語權。
“長期以來,全球科技領域的開源項目多由國外主導,我們在人形機器人領域亟待打破這一局面,建立屬于自己的全尺寸開源社區。”江磊說,通過開源,把相關技術向全社會開放,降低進入門檻,這樣就有更多資源、更多開發者涌入這個行業,有利于促進整個行業的發展。“3年至5年后,人形機器人基本上可以在物流分揀等一些簡單生產線上使用,5年至10年后,基本上可以在家庭、服務等要求比較高、比較開放的環境下使用。”
針對當前人工智能行業普遍困擾的“大模型缺乏高質量訓練數據”等問題,國地中心將提供標準化的數據采集工具,以及基于數字孿生系統完成的快速數據二次評估。此外,國地中心還將構建開放、開源的標注工具,鼓勵生態聯盟單位一起加速數據集構建,通過開源數據場景和行業專用數據賦能應用。
目前,在國地中心打造的OpenLoong開源社區網站上,已經開源了機器人硬件結構及參數,即將開源具身智能軟件包。總體來看,人形機器人這個賽道目前規模還比較小,開源生態的建立有望吸引更多人才和企業加入,共同突破人形機器人的共性關鍵技術。
除了“青龍”系列機器人項目,目前,國地中心還在加快推進訓練中心建設,推動人形機器人在更多的真實場景中應用落地。根據規劃,中心首期可容納100個人形機器人訓練,計劃到2027年可容納1000個人形機器人同時訓練。
作為2024世界人工智能大會入口處“十八金剛”之一,傅利葉通用人形機器人GR-1已于7月在建設銀行上海浦東分行出任“大堂經理”。
“在建行的銀行大堂經理場景訓練基地,GR-1承擔的工作包括引導客戶、分流叫號,還能對客戶進行簡單的反詐培訓。”傅利葉智能CEO顧捷說,“目前,GR-1比較側重與客戶進行語言交互,我們希望下一步可以更多地開發身體功能,讓機器人完成迎賓接待、巡邏、文本裝訂,甚至存取款的工作。”
公眾非常期待讓人形機器人提供照顧老人孩子等家庭服務,客觀看,距離人形機器人實現大規模商用,甚至以平價“飛入尋常百姓家”,到底還有多遠?
“未來可期,投資火熱,但大熱賽道更需要冷靜攻堅。”許彬說。
“目前的人形機器人,功能有限,價格昂貴。在ChatGPT出現之前,大家也覺得AI不夠智能,這和人形機器人目前的狀態有些類似。”宇樹科技創始人、CEO王興興說。
“場景豐富是我們的最大優勢之一。有場景,就有望驅動技術的攻堅突破。說到底,目前人類科學仍在弱人工智能階段,人形機器人離‘像人一樣學習和理解’還差十萬八千里。眼下最重要的是走出實驗室,真正走向市場。”中國科學院院士丁漢說。