(本文作者爲 鏡相工作室,鈦媒體經授權發佈)
文丨鏡相工作室,作者 | 黃依婷,編輯丨胡苗
北京亦莊南海子公園,終點線前。
“天工Ultra”穩穩地向終點線衝來,鏡頭、目光、快門聲一齊聚攏。去年的北京亦莊人形機器人半程馬拉松上,它曾以2小時40分42秒的成績拿下冠軍,是那場賽事的王者。
但在今天的比賽中,觸線之後,它沒有直行,沒有減速,沒有停下。機身微微一偏,徑直衝入路邊綠化帶。工程師們上前“急救”,用擔架將它抬離賽道。
觀衆笑稱:“機器人也被勝利衝昏了頭腦。”
沒人知道,它是被人羣遮擋視線、誤判終點爲障礙,還是導航在最後一刻失準。這一幕短促、意外,也恰恰照見了機器人行業最直白的現實——進步與失控,只在一瞬間。
人形機器人的發展超乎想象。一年前,人形機器人被拖着完成比賽,參賽機器人的身後,跟着一溜扛着電腦的工程師。他們在一旁牽引、遙控,需要頻繁介入糾正方向,更像是一場人機協同接力。
一年後,賽場規則本身發生變化,陪跑員被取消,人工干預被嚴格限制,場內外換電會直接影響成績計算,有40%的機器人實現了自主導航。人形機器人第一次獨立面對一條複雜而漫長的真實道路。但最快完賽時間直接縮短近兩個小時,最短完賽時間爲50分26秒,機器人從面前掠過,只剩一道殘影。
這條賽道本身也像是爲機器人量身設計的一本“難題集”。全長21.0975公里,從平地到坡道,從連續彎道到狹窄路段,再到南海子公園內接近90度的急彎與下坡組合,十餘種地形被串聯在一起。對人類跑者來說這都不輕鬆,對於機器人來說更是挑戰,每一個轉彎、每一段坡度變化,都是對感知、決策與控制系統的同步拷問。
在這條賽道上,對人形機器人的考驗被拆解爲多個維度:運動控制決定它能否穩定奔跑,能源管理決定它能跑多遠,感知決策決定它能否找對方向,而熱管理與機械結構,則構成了這一切能否持續運行的基礎。
機器人在成功之餘,也交出了一本“錯題集”:有的因爲高溫需要暫停降溫,有的突然迷路慌慌張張,有的步伐不穩如醉酒大漢,即便是去年的冠軍“天工Ultra”,也發生了開頭那幕。
但一定程度上,失敗比成功更有意義。每個失衡、誤判、中斷,都暴露了機器人在實驗室環境裏被掩蓋的短板。這些真實故障更能讓行業看清邊界、找到方向。
也正是在這樣的背景下,賽場上那些看似細碎的差異,開始變得耐人尋味:爲什麼有的機器人選擇穿鞋,有的堅持裸足?爲什麼有的步伐大開大合,有的卻以高頻小步前進?爲什麼有的外形如嬰兒,有的又是成年人的模樣?爲什麼同樣的彎道,有的機器人可以流暢通過,有的卻必須減速甚至停頓?
圍繞這些看似簡單的現象,我們邀請了快思慢想研究院院長田豐,以及零零後科技創始人兼CEO張振堯,從他們各自的視角對這場“人形機器人半馬”進行拆解。
追趕博爾特
有的機器人跑得像博爾特,有的像喝多了,它們的速度、步幅差異明顯,本質受哪些因素制約?
“在控制能力還不夠成熟的情況下,很多系統會主動選擇更保守的小步策略。”
田豐:步幅最直接的決定因素,其實是關節電機的扭矩。扭矩越大,機器人“力氣”越大,就可以一步邁得更遠,這是最基礎的物理約束。但這並不是唯一因素,還跟控制算法密切相關。如果控制系統對大步態的穩定性把控不夠,它可能會被迫採用小步快走的策略。因爲小步的好處在於調整空間更大,一旦姿態有偏差,可以更快修正,整體穩定性更高。
這裏面一個關鍵點是系統的響應延遲。人形機器人全身可能有幾十個自由度,比如30多個關節電機。在邁大步的時候,這些電機需要非常高頻、同步地完成姿態調整,對控制系統的實時性要求極高。如果延遲過大,重心來不及修正,就很容易失去平衡、直接摔倒。所以在控制能力還不夠成熟的情況下,很多系統會主動選擇更保守的小步策略。

參賽的榮耀機器人。圖片來源:賽事官方
至於步頻,本質上取決於電機的響應速度和驅動能力,可以理解爲控制信號的刷新頻率和執行能力。如果電機性能更好、驅動更強,單位時間內可以完成更多次步態循環,步頻就能提高。從系統角度看,步頻不僅是控制問題,也和電力系統密切相關。因爲更高頻率的運動意味着更高的功率輸出需求,如果供電能力不足,或者電機性能不夠,就很難支撐高步頻運行。
爲什麼今年人形機器人的完賽時間比去年大幅縮短了?
“電動車產業鏈正在往機器人領域遷移。”
田豐:其實是得益於咱們電動車產業鏈,這套產業鏈現在正在往機器人領域遷移。我們可以看到,關節電機、電池這些東西在持續進步,整體性能在提升,同時國產化率也越來越高。
另外一個很重要的點是,廠商在算法上的投入也在加大。有的機器人廠商,它一半的研發費用投在“小腦”和“大腦”上,也就是運控和邏輯思考這兩部分。這一塊其實會帶來很大的價值。
現在機器人需要一邊跑一邊換電池,有的一場比賽下來換四五次,就不能把電池包擴大嗎?
“堆電池容量是下下策。”
張振堯:按照目前電化學的發展,一塊電池很難驅動一臺身高1.8米的全尺寸人形機器人跑完“半馬”,這是一個客觀現實,所以纔會有中途換電或換機器人的方案。接下來的權衡其實就是數學計算。
比如,爲了避免換電,我們可以把電池包增大,那整機重量、體積就會上升,這意味着電機要輸出更大的扭矩來維持相同的奔跑速度,而更大的扭矩意味着更高的電流和發熱,最後又要消耗更多的電能……陷入了循環。
所以堆電池容量是下下策。最好的狀態是,把電池的重量控制在整機重量的10-15%,讓人形機器人可以以比較敏捷的步態、依靠多次換電完成比賽。
今年有一個創新點是,有的隊伍做到了不斷電換電。這是一個非常好的技術路線。原來的換電過程是,把電源線拔掉,系統斷開,換電後重啓,校準傳感器等等,這個過程非常漫長,還存在一些工程上的不確定性。但現在,他們給機器人裝上多塊電池包,可以先更換一塊電池,讓備用電池供電,達到不斷電、系統不關機的效果。
我們希望用一塊電池去完成整個流程,這其實是大家的一個終極夢想。但我們不能指望奇蹟——材料學突然發生重大突破,我們要基於現有的情況來看。我認爲突破點在“動能回收”,就是從目前這種能耗比較高的“伺服結構”,變成能量回收效率非常高的被動行動狀態,比如用腿部的彈性儲能機制去回收每一步落地的動能。這其實和新能源車下坡回收動能的設計很類似。
OOTD有說法
爲什麼有的機器人穿鞋、有的不穿?
“機器人也會磨損‘半月板’。”
張振堯:機器人穿不穿鞋,體現在工程學上就三個指標,地面接觸模型、摩擦係數和衝擊吸收。
機器人每邁出一步,腳接觸到地面,會產生體重2-3倍的反作用力,如果這個反作用力直接沿着腿部連桿向上傳導,它會對踝關節和膝關節造成高頻衝擊,非常容易發生金屬疲勞和斷裂。像人一樣,跑步、登山多了,半月板會磨損。這裏跑鞋的作用就是吸收衝擊力,隔離一些高頻振動,有效保護機器人的關節和電機。
還有一個,人也能直觀感受到,就是跑鞋鞋底的設計。機器人的裸足,一般是金屬或碳纖維,摩擦係數比較低,直接接觸柏油馬路容易發生比較小的位移,不穩定。這種微小的偏移會讓機器人的算法出現誤差,進而導致重心或空間位置的偏移,甚至引發系統振盪。如果給機器人穿上合適的跑鞋,它能大幅提高靜摩擦,也不容易在柏油路面發生微小的位移。尤其是過直角彎時,跑鞋帶來的高摩擦力能夠幫助機器人維持向心力。
穿鞋也會帶來兩個小問題。一個是前期訓練的模型裏,沒有把跑鞋柔軟的材料、鞋底的厚度放進去,導致機器人不知道自己穿了鞋,可能會對它的算法造成一定擾動,比如踏空。另一個是,鞋子的重量會增加機器人腿部末端的重量,進一步增加腿部能耗。但我覺得這兩個問題都不是很大,現在用的強化學習算法有很強的魯棒性(也稱穩健性),給機器人穿一雙跑鞋是利大於弊的。

穿鞋參賽的人形機器人選手。攝:黃依婷
前兩天北京下雨,參賽隊伍紛紛給機器人披上雨衣。對於人形機器人來說,防水是一件很難的事嗎?
“如果真的做出防水機型,它的整機成本會比現在至少上升五倍。”
張振堯:我認爲機器人防水是一件非常困難的事情。人形機器人集成了大量傳感器和設備,設計之初就沒有考慮到要去防水性工況下使用,它的電源接口、關節之間的連接件、甚至很多走線是完全裸露在外的。有的人如果要搗亂,剪掉其中一根電線,就可能導致整個機器人系統的徹底癱瘓。
在當下這個階段,給人形機器人做防水太複雜了。現在很多團隊在機器人的關節處做了很多創新設計,讓機器人跑得更高效。這些機械結構是帶有實驗性的,如果現在就考慮防水性能,我覺得太早了。再進一步,如果真的做出防水機型,它的整機成本會比現在至少上升五倍,其實也不符合人形機器人的商業化落地需求。
高矮胖瘦,各有用途
不同參賽機器人在高矮胖瘦上的差異很大,今年最矮的機器人只有75cm。人形機器人的最優體型是否存在?
“不同應用場景下,人形機器人會有各自更適合的體型。”
張振堯:這個問題其實沒有一個標準答案,更準確地說,需要放在具體任務裏去討論。不同應用場景下,人形機器人會有各自更適合的體型。
比如體型較小的機器人,它的優勢在於整體重量輕、擺動幅度可以做得很高,同時重心低、穩定性好。在受到外界干擾,比如碰撞時,不容易摔倒;即便摔倒,電機和整機受損的風險也更低,而且整體功耗更小。
但它的侷限也很明顯,單步跨度有限。如果想達到較高速度,就必須依賴更高的步頻,這會顯著增加電機負載和散熱壓力。小型機器人對複雜地形的適應能力較差,比如臺階、坑窪等,很容易成爲無法跨越的障礙。所以這類形態的機器人更適合室內環境或算法驗證,不太適合長距離、複雜路況的戶外運動。
再看全尺寸人形機器人,它的優勢在於可以更好地利用動力學,比如類似鐘擺的被動動力學機制,讓腿部擺動更高效,從而在單位距離上的能耗更低。同時,它和人類空間是一一對應的,可以直接複用樓梯、通道等基礎設施,不需要額外適配。
但問題在於,一旦摔倒,風險會非常高。因爲體重大、勢能高,衝擊力也更大,很可能直接對整機造成嚴重損傷。這類機器人對電機性能和控制算法的要求也更高,需要更強的扭矩輸出和更精細的平衡控制來避免摔倒。它們更適合工業製造、物流搬運、應急救援等場景,以及需要與人類實現一比一替代的通用任務。
未來會不會出現專門爲跑步優化的非標準人形結構?
“完全復刻人類的雙足直立形態,未必是最優解。”
張振堯:如果單純從“跑得更快、更久”這個目標來看,完全復刻人類的雙足直立形態,未必是最優解。自然界中跑得最快的動物,比如鴕鳥,其實並不是標準的人形結構。它的腿部是反關節結構,而且主要肌肉集中在大腿根部,以提高效率和爆發力。
類似的思路在機器人設計中也已經出現,比如去年有一款人形機器人,屁股好大,其實那個地方是放了兩個碩大的電機,相當於人類的肌肉一樣。或者採用更輕量化的材料結構,甚至在某些場景中去掉上半身或手臂。但這類設計更適合特定任務。
從長期來看,如果目標是進入家庭、醫院或通用服務場景,人形機器人仍然需要在“類人”“仿生”這個方向上收斂。目前比較流行的人形機器人體型,是身高在1.6-1.8米、體重在50公斤左右的類人機器人。這是綜合運動性能、能耗以及與人類生活空間適配性之後,一個相對均衡的結果。
全自主導航的噩夢
今年大約40%的參賽機器人自己跑,遙控還是佔大部分,挑戰在哪裏?
“人形機器人奔跑產生的衝擊力,不僅會損害關節,對感知系統也是噩夢。”
張振堯:自主導航分爲兩個方面,一是機器人要去感知外部環境,二是根據感知到的外部環境去做決策。
感知層面,馬拉松賽道和實驗室環境差別非常大。比如光照,因爲有云層、樹的遮擋,還有角度的變換,會發生劇烈的變化。再比如路面,有其他機器人,有觀衆,有複雜線條。這些必須依賴機器人的視覺、IMU(慣性測量單元,大多用在需要進行運動控制的設備)、激光雷達、關節等傳感器的輸入,來認知周邊環境。這方面現在最大的問題是數據噪聲和計算延遲。
數據噪聲指人形機器人奔跑產生的衝擊力,它不僅會損害關節等機械結構,對感知系統來說也是噩夢。當衝擊力瞬間傳導到IMU系統時,系統會誤以爲自己處於一個劇烈晃動的環境,進而導致系統失效。這種高頻振動也會影響視覺系統,比如產生類似相機“果凍效應”的畫面畸變,進一步干擾識別精度。
爲了過濾噪聲,我們需要給機器人加上濾波算法、搭載深度學習模型。但受制於電池容量,機器人身上搭載的邊緣計算芯片算力有限,最終可能會出現感知系統和運動控制系統“搶”算力的情況。感知系統“搶”贏了,運控系統算力不夠,機器人可能直接“抽搐”;兩個系統“打平手”,算力消耗過大,電機過熱,可能整個系統會直接降頻甚至癱瘓。

天工Ultra人形機器人衝線後撞入綠化帶被抬走。攝:黃依婷從去年到今年,爲了實現全自主導航,有提出那些解決方案?
“從遙控到自主導航,真正的跨越在於人形機器人的決策能力。”
張振堯:今年最大的提升在高精度全局定位系統的修正以及多系統耦合上。一方面,我們在算法上普及了視覺和IMU的里程計,即使視覺短暫丟失,IMU也可以通過融合算法支撐數百毫秒的推算。當某一個傳感器失效時,可以通過其他系統進行狀態估計,不需要所有傳感器都始終在線。另一方面,這次比賽中使用了高精度RTK定位技術,可以提供釐米級的絕對位置參考。這相當於給機器人提供了一個來自太空的座標系,能夠有效解決長距離奔跑中的累計誤差問題。某種程度上這是一個開了外掛的能力。
感知解決了“我在哪裏、我看到了什麼、我的狀態如何”的輸入問題,下一步就是輸出。從遙控到自主導航,真正的跨越在於人形機器人的決策能力。它並不在于于機器人跑得多快,而在於它的“大腦”能否實時在複雜環境中做出正確的決策。
現在的進展在於,邊緣計算系統已經可以實時生成類似柵格地圖的環境模型,預測前方行人或其他機器人的運動軌跡,並在數百毫秒內規劃出一條平滑的路徑,比如如何避讓、如何超車。這一套邏輯其實已經非常接近自動駕駛中的路徑規劃和決策系統。
再往上一個層級,是今年開始嘗試引入大模型能力。機器人在面對障礙物時,不再只是執行簡單的左轉或右轉規則,而是可以通過視覺語言模型去理解障礙物的語義,比如這是靜態路障還是一個正在移動的人或機器人,從而做出更接近人類的決策。
不過,目前還無法實現百分之百無人干預的全程運行。現實環境中存在大量不可預見的極端情況,比如強光直射導致傳感器失效,路面積水帶來的干擾等。在這些場景下,系統仍然缺乏足夠的常識和自我保護機制,可能只能通過重啓來恢復奔跑的狀態。
跑馬拉松的意義
爲什麼一定要讓人形機器人跑馬拉松?
“馬拉松本質上是一個暴露短板的過程。”
田豐:我覺得它其實是一個命題作文。我們在設計這個題目的時候,並不知道是不是所有機器人都能完成,但正因爲這樣,它纔有價值。它把原來實驗室裏的標準環境,變成了一個真實的、複雜的、充滿不確定性的世界。你要看的是,機器人能不能把在實驗室裏訓練出來的速度、效果、智力,真正遷移到現實環境中去。這本質上是在考驗它的泛化能力。
這件事不是單一能力的比拼,而是一個全產業鏈能力的體現。過去幾年,很多廠商其實是在買產業鏈上的標準化零部件,但標準品的二次優化空間是有限的。現在你會看到,越來越多廠商開始自研核心零部件,不只是做“大腦”,也在往上游走,根據自己的應用場景去反向定製供應鏈。
當你的整體能力提升之後,就會產生能力溢出。有的溢出體現在工廠場景,比如手部操作和大腦決策能力,有的溢出體現在馬拉松這種場景,就是下肢運動能力、全身平衡能力以及複雜環境適配能力。
所以我覺得馬拉松本質上是一個暴露短板的過程。誰做得好,說明系統更均衡,誰做得不好,就可以看到問題在哪裏,再去補齊。這是一個很好的訓練和篩選機制。
再往後看,這種比賽形式本身也會演化。比如可能會出現越野賽、登山賽、城市路面賽,甚至像人類一樣區分短距離衝刺和全程馬拉松。短距離更考驗峯值速度、爆發力和協調性,長距離則更考驗續航、熱管理,以及核心零部件的耐久性和系統的長期穩定性。
每一年,環境更復雜、要求更高,逼着整個行業去提升。通過公開的比賽,讓問題更早暴露出來,是一件好事。不只是第一名值得關注,那些在比賽中摔倒的機器人,其實同樣重要。因爲這些失敗會產生大量“負樣本”數據,而這些數據,對於系統的快速迭代和能力提升,是非常有價值的。
讓人形機器人跑得更快重要嗎?
“工廠裏不需要跑得特別快,但在搜救場景中,機器人需要和時間賽跑。”
田豐:跑得快這件事有一個關鍵指標,就是峯值速度。這個峯值速度是一個理論值,因爲在真實環境裏一定會打折扣。你有熱管理、電池這些約束,不可能一直以峯值速度去跑,整體系統也堅持不住。所以一般來說,實際運行速度大概是在峯值的75%到80%這個區間,已經是一個比較理想的狀態了。
跑得快的價值在於,我的能力上限在哪裏。就像在工廠裏,可能不需要跑得特別快,但在搜救場景中,你是需要和時間賽跑的。再比如巡檢,移動速度越快,效率就越高。所以不同場景,對速度的需求是不一樣的。
我覺得這件事還有點像奧林匹克。奧林匹克本質上是在不斷挑戰人的專項能力極限,而人形機器人跑馬拉松也是一樣,不管是手臂的負載能力,還是腿部的運動速度,都需要不斷去逼近甚至突破極限。而且這個極限,未來很可能會超過人的生理邊界。




