中建三局取得用于室內外工作的移動式碼垛機器人專利有效減輕現場工人負擔
2024年是一個具有里程碑意義的年份。在全球科技競爭的焦點下,通用具身智能領域迎來爆發:
在這場激烈角逐中,普渡、宇樹、智元、銀河通用這四家通用具身智能企業憑借獨特的技術實力和清晰的商業路徑,正在快速拉開與其他玩家的差距。一整年的高光時刻無不彰顯:他們正在重塑行業發展新圖景。
為什么是這四家?他們究竟憑什么能突出重圍?本文將從技術路線、產品矩陣、商業化進展等維度,深度剖析這四家企業的核心優勢與發展策略,揭秘他們的創新突圍之路。
普渡機器人自2016年成立以來已累計獲得超過10億元融資,主要投資方包括美團、騰訊、紅杉等頂級投資機構。據沙利文研究的統計數據顯示,2023年普渡機器人以23%的領先份額位列商用務機器人市場全球第一,并以接近半數的份額領跑中國廠商出海,是唯一在通用具身機器人商業化方面跑通過前期市場驗證的廠商。
在業內在探討“人形是否是終極形態”時,普渡用行動給出了更具前瞻性的答案:專用、類人形、人形機器人三種形態將共同構成行業未來生態。通過這三種形態的機器人與服務配送、清潔、工業配送多品類產品矩陣的相輔相成,能夠覆蓋從工業、家庭與商業領域中參差多態的場景與需求。
這一戰略選擇源于對客戶需求和機器人技術本質的深刻理解。通過“移動+操作+AI”三大技術棧并行發展,普渡不僅構建起完整的通用具身機器人技術體系,更開創了一種全新的技術范式:以應用場景為導向,讓不同形態優勢互補,實現技術突破與商業落地的雙輪驅動。
這種策略體現在普渡機器人CEO張濤此前提出的“單位工作面積內的自由度”創新概念上,這一概念以機器人總自由度與工作面積的比值為基準,來衡量三種形態各自適配的場景,以打造最具商業落地能力的具身智能。
在應用場景中,專用機器人以高效率應對標準化場景,類人形機器人在半結構化環境中展現靈活性,人形機器人則突破復雜場景的環境適應能力,形成多形態協同的完整技術生態。
12月19日,普渡發布全尺寸雙足人形機器人PUDU D9。此前的9月19日,普渡發布了初代類人形機器人PUDU D7,隨后又在10月發布了其11自由度五指靈巧手PUDU DH11,成為業內首個實現三種形態全面布局的企業。
PUDU D9身高170cm,擁有42個自由度,最高關節扭矩達352Nm,搭載此前發布的五指靈巧手PUDU DH11,擁有高度仿人的雙足行走及雙手操作能力。在最新演示視頻中,PUDU D9重點展示了雙足能力,完成直立行走,抗干擾,上斜坡等動作,并操作普渡另一款產品PUDU SH1完成地面清潔任務。而此前發布的類人形機器人PUDU D7,其全向移動輪式底盤支持360度靈活轉向,能夠在2D平面空間內實現更高的移動效率。
在核心部件方面,普渡自研的DH11五指靈巧手采用11自由度設計,配備12個觸覺傳感器區域和1018個感應矩陣點構成的觸覺系統,實現了對物體的精細化感知和操控。目前,普渡已實現了機械臂關節、夾爪和靈巧手的自主研發。
普渡在專用機器人領域深耕多年,形成了服務配送、商用清潔、工業配送等場景的完整產品線。直至此次人形機器人發布,普渡成為行業內唯一完成了多品類產品+多元形態的完整產品矩陣布局的廠商,構建起覆蓋全場景的完整解決方案。
這背后源自普渡長期以來的經驗遷移:由于不同公司的不同類型機器人在真實場景中經常存在調度和協作的問題,當用戶的需求呈現出多元化、復合型的發展趨勢,只有同時發展多品類的產品矩陣,才能解決場景融合下客戶的各種痛點,為客戶帶來一致的使用體驗。
普渡打造的不僅僅是“通用機器人”,更是“通用的”機器人產品體系。如今,伴隨著多種形態機器人逐漸進入市場,可以預見,同一場景下專用、類人形、人形三種形態機器人之間的協作將在不久的未來實現。盡管人形機器人自身具有高度通用性,但在一個包含三種形態的未來生態中,只有多品類產品矩陣才能夠實現全棧式具身智能。普渡如同“機器人界的蘋果和小米”,多品類產品矩陣不僅能夠提供更廣泛的應用場景,還能夠確保不同形態機器人之間的高效協作,這是普渡獨有的、其他單一的人形或專用機器人廠商所不具備的競爭優勢。
在移動能力方面,普渡開創性地采用輪/足雙形態并進策略。足式移動方面,人形機器人PUDU D9實現了2米/秒的行走速度,可通過最大10度的斜坡,能夠自如應對樓梯、斜坡等復雜地形。早在2021年起,普渡便開始了足式機器人的研發,在技術層面,普渡采用強化學習的方式來開發足式技術已經非常成熟;輪式移動方面,普渡機器人在定位、感知、規劃、調度、控制等方面早已形成行業領先技術優勢,可以直接實現技術復用,類人形機器人PUDU D7的全向移動系統支持360度靈活轉向,通過創新的多傳感器融合導航方案,確保了高動態復雜場景下的精確定位和穩定運行。
在操作能力上,普渡機器人通過AI大模型持續提升服務機械臂的泛化性,包括對象、工具、環境、任務和不同構型5個維度。在機械臂設計方面,D7及D9均采用雙臂協同方案,每條手臂具備7自由度,雙臂負載能力達到20kg以上,通過深入的機械結構優化和精密控制算法,實現了0.1mm的末端重復定位精度,能夠執行各種精細操作,如抓取、搬運和組裝,適用于多種復雜的工業和商業服務場景。
AI方面,普渡采用了行業領先的自研具身智能技術架構。采用動捕、遙操作、視頻等多類復合數據驅動具身智能,并在大模型應用上采用“大腦大模型”與“小腦大模型”分離的策略,結合高精度的視覺、觸覺、力覺、聽覺傳感器,人形機器人D9和類人形機器人D7可實現具身智能級別的多模態交互。
創新的大小腦分離架構優化了決策與控制效率,三層數據學習策略實現了直接操作、半模擬、互聯網數據的深度融合。多模態交互系統則打造了視覺、語音、觸覺的協同,大幅提升了人機交互的自然度。即使面對全新的物體或環境,經過充分訓練的機器人也能夠快速適應并完成任務。普渡人形和類人形機器人能通過持續的學習進化不斷提升任務的泛化性,并持續突破跨場景端到端任務的邊界。
普渡機器人展現出令行業矚目的全球化商業能力。作為出海最早的一批中國機器人廠商,目前,其產品已行銷60多個國家和地區,累計構建了700多家代理商組成的全球渠道網絡,海外營收占比穩定在8成以上,是F4中唯一具有全球化渠道能力的通用機器人廠商。
量產方面,普渡擁有商業技術端的長期積累以及強大的供應鏈管理能力。今年8月,普渡在江蘇鹽城年產能達到10萬臺的超級工廠正式落成,截至目前其累計出貨量已超過8萬臺,是全球出貨量最高的商用服務機器人企業。相比許多產品還停留在實驗室樣機階段的機器人公司,普渡已經成功地將產品實現規模化量產并出貨,是極少數具有復雜硬件的工程能力和量產能力的機器人廠商。
更重要的是,普渡已在餐飲、零售、倉儲物流、酒店、工業、醫療、教育、養老、公共服務等十大行業形成了成熟的解決方案和項目落地經驗,其在商用服務機器人領域全球市占率第一的地位充分驗證了其解決方案的全球競爭力。通過強大的渠道優勢和深度本地化服務,普渡成功構建起其難以復制的商業壁壘。
宇樹科技今年9月完成數億元的C輪融資。由北京機器人產業投資基金等機構領投,美團龍珠、中關村科學城、琥珀資本、上海科創基金、紅杉資本中國、中信證券、祥峰投資中國基金等參與投資。
在當前通用人工智能快速發展的背景下,宇樹科技明確將機器人本體作為核心業務。相較于其他機器人公司,宇樹更側重于強調機器人的“身體”對于提升“大腦”能力、實現AGI的重要性。
宇樹科技采取以機器人硬件本體研發為基礎,AI模型研發為輔助的業務模式。在保持硬件核心競爭力的同時,也積極與各類大模型公司開展合作,將優秀的AI技術整合到產品中。
宇樹的產品線主要包括四足機器人和人形機器人兩大類。在四足機器人領域,推出了A1、Laikago、Go1、Go2等系列產品。在人形機器人方面,研發了H1全尺寸人形機器人和G1高自由度高性價比人形機器人。
H1采用了先進的硬件配置:身高約180CM,體重約47kg,峰值扭矩密度達189N.m/Kg,移動速度可達3.3m/s(世界紀錄),潛在運動性能甚至可超過5m/s。配備3D激光雷達和深度相機,實現全景掃描,搭載Unitree M107關節電機,提供超強動力性能。
G1則面向更廣泛的應用場景:身高127cm,體重35kg,移動速度2m/s,單手臂最大負載3kg,續航時間約2小時,搭載激光雷達及深度相機,關節電機數量23-43個。
2024年12月23日下午,宇樹科技展示了行業級機器狗B2-W(B2機器狗的進階版)的技術演示視頻。該產品因其卓越的上山入水及載人能力而受到關注,包括高難度體操動作、山地駕馭、急速涉水、攀爬濕滑石頭坡等。據宇樹科技介紹,該產品已發布量產一年,其工業輪足設計擴展了產品的應用能力。
作為宇樹科技的主打產品,四足機器人(機器狗)至今仍是公司的核心業務領域,多次出現在英偉達的機器人研究項目中。近期,加州大學研究團隊與英偉達合作開發的視覺語言模型NaVILA,用于實測的機器人包括宇樹科技的Go2、G1機器人。
宇樹科技團隊在機器人動力學、控制算法上有深厚積累。在人形機器人技術發展中,雖然硬件層面還需要提升電機扭矩、延長減速器壽命、提高負載能力、增強操作精度、提升視覺感知分辨率和加快執行速度等,但宇樹科技認為硬件并非最大的限制,因為這些都是工程問題,沒有理論門檻,在時間上是可以預估的。
在AI方面,宇樹科技目前主要通過強化學習訓練機器人掌握運動控制能力,尤其是在復雜地形上的適應能力和運動能力。盡管通過增加算力和數據可以提升機器人某一方面的能力,但機器人通用AI模型在全球范圍內還沒有突破臨界點,這被視為當前機器人行業的一大限制。
當前,機器人大模型的技術路線尚未像大語言模型那樣形成清晰共識。宇樹科技CEO王興興認為,在硬件層面,關于攝像頭配置、傳感器部署、觸覺感知等問題,業界仍在探索最優方案。
據悉,在知識產權方面,宇樹科技已累計獲得超過180項國內外專利,其中授權專利超過150項,涵蓋機器人核心零部件、運動控制和感知等關鍵技術領域。這些專利儲備鞏固了公司的行業領先優勢。通過持續的技術創新和精細化的成本控制策略,公司成功實現了產品的高性價比。
在產業鏈布局方面,宇樹科技建立了完整的全產業鏈體系,實現從原材料到核心零部件的自主生產。同時,公司搭建了開源機器人開發平臺,推動行業技術創新和生態建設。這種全產業鏈的整合能力,使公司能夠更快速地響應市場需求變化,同時提升產品品質和生產效率。
在商業落地方面,宇樹展現出務實的推進策略。2024年4月,Unitree H1已開始在蔚來汽車工廠進行試點,參與搬運等工作,實現激光雷達定位、機器人操作、AI識別等全自主流程。
目前的應用主要集中在相對容易落地的小場景和工業局部環節,以定向訓練為主。雖然在特定任務上取得進展,但距離通用場景應用還有一定距離,機器人帶來的商業價值尚未完全超過人工成本。
在場景布局方面,宇樹科技采取開放態度,并不將重心局限于工業領域。G1已在科研、教育、工廠等多個場景實現落地應用,銷量符合預期。公司認為家用場景是人形機器人的重要發展方向,但當前的G1產品尚不具備端茶倒水和洗衣做飯等復雜家務能力。
智元機器人2023年3月拿到天使輪融資、一年內連續獲得5輪融資、合計21家參投機構。今年9月,智元機器人完成 A++++++ 輪融資,投資方包括慕華創投、軟通動力、LCVPF Holdco Limited、慕華資本以及中科創星,其中中科創星為老股東。
智元機器人認同家庭應用是未來的大方向,但由于家庭場景下的任務比工業場景更復雜,選擇了先做B端,從B端不斷積累能力和數據后再切入C端的發展策略。從目前發布的產品來看,智元主要聚焦在交互服務(遠征A2)和工業場景(遠征A2-W)兩大領域。
智元參考自動駕駛L1~L5的技術分級體系,提出了從G1到G5的演化路徑和技術框架:從基礎自動化-人工編排,到通用原子技能-任務編排大模型,再到端到端操作技能-認知推理規劃大模型,接著是端到端操作大模型(認知推理規劃大模型+通用操作大模型),最終達到AGI和感知決策執行端到端大模型。隨著大腦向更高階段演進,對數據的需求呈現指數級增長趨勢。目前智元判斷自己處于從G2到G3的發展階段。
智元機器人認為,對于機器人來說,最關鍵的是動作編排大模型,而不是語言大模型,并將動作編排大模型定位為公司戰略的核心。與通用大模型依賴互聯網數據并需要整個行業共同發展不同,動作大模型的數據必須從實際場景中采集。
智元機器人合伙人兼營銷服副總裁姜青松表示,要獲取工業場景的數據,關鍵在于讓機器人真正深入工廠提供服務。尤其是工人在實地指導機器人工作的過程中,這種互動產生的數據具有最高的應用價值。
從2023年8月發布的遠征A1,到2024年8月發布的五款商用人形機器人(遠征A2、遠征A2-W、遠征A2-Max、靈犀X1及靈犀X1-W),智元形成了完整的產品矩陣。
遠征A1作為第一代通用型具身智能機器人,具備49+自由度、175cm身高、55kg重量、5kg單臂負載等特性。遠征A2系列針對不同場景:專注于營銷客服、展廳講解、商超導覽等場景;A2-W面向柔性制造,能夠將工人從枯燥、耗時耗力、重復性高或高危險性的崗位中釋放出來;A2-Max則以40kg負載能力鎖定重載搬運、碼垛等應用場景。靈犀X1-W則是專門用于數據采集的機器人,將在上海的數據采集工廠中發揮重要作用。
智元的“具身智腦”EI-Brain框架將機器人的具身智能思維系統分為四個層級:云端超腦(任務級)、端側大腦(技能級)、小腦(指令級)和腦干(伺服級)。其中任務級負責理解用戶整體需求,將指令轉化為具體任務目標;技能級將任務分解為具體技能操作;指令級負責將技能級分解為更具體的操作指令;伺服級則負責控制機器人的具體動作和執行。
在大模型方面,智元使用兩類大模型:一是采用科大訊飛的通用類大模型,用于實現機器人的語音交互功能、任務編排和對物理世界的認知能力;二是自研的動作編排大模型,通過結合語言、視覺和動作處理能力,用于指導機器人在復雜環境中執行任務。智元認為動作編排大模型在公司戰略中占據中心位置,其重要性超過語言大模型。
在商業化進展方面,智元已在G2階段實現的通用原子技能(如位姿估計模型UniPose、抓取模型UniGrasp、力控插拔模型UniPlug等)已在多個實際場景中得到商業應用。為加快向G3階段推進,智元建立了完整的具身數據系統AIDEA(Agibot Integrated Data-system for Embodied AI),包括數采本體、遙操設備和數據平臺。
12月16日,智元機器人對外宣布開啟通用機器人商用量產。其臨港工廠10月開始生產,經過產能爬坡后于12月開始大上量,預計年底前將下線臺,自用兩百多臺,雙足機器人占總出貨量過半。當前產品主要應用于交互場景和柔性制造場景,明年年將進一步向特殊場景等領域拓展。
同時,智元布局了業內最大的具身數采工廠,上百臺機器人同時作業,日產數萬條機器人真機數據和仿真環境數據。工廠內還搭建了臥室、客廳、衛生間等多個人類生活空間的模擬場景,為產品未來進入家庭場景做準備。
今年11月份,北京銀河通用機器人有限公司完成了一筆5億元的戰略輪融資,成立一年多以來,該公司融資規模已超過10億元。
銀河通用認為現階段并不是人形機器人的雙手操作能力已經足夠強了,反而是大量場景下的工作,傳統的機械臂還沒辦法勝任。因此,帶雙足形式的人形機器人不一定是最優解,反倒是會徒增成本。基于這樣的考量,公司在產品設計上采取了應用場景導向的策略,優先關注“雙手”的落地場景。
2024年6月發布的Galbot G1配備173厘米身高和190厘米臂展,通過65厘米的身體升降功能,可實現0至240厘米的垂直工作范圍。在執行機構上采用左手吸盤、右手夾爪的差異化配置,下肢則采用可折疊單腿配合輪式底盤的組合設計。這種結構在滿足特定場景實用性的同時,也降低了機器人本體成本。目前,Galbot G1已掌握藥品上架、零食取送、開柜子、開抽屜、晾衣服等泛化操作技能,可在無人值守的零售商超中完成盤點、補貨、取貨、打包等全流程工作。
銀河通用認為目前機器人大模型在數據來源和動作輸出頻率方面存在明顯局限性。在數據來源方面,與特斯拉端到端自動駕駛模型可以從百萬車主獲取數據不同,機器人大模型的數據來源非常有限。在動作輸出方面,基于谷歌RT-2大模型的機器人動作輸出頻率僅為1-3Hz,相比Figure AI使用小模型達到的200Hz還有很大差距。
針對這些問題,銀河通用提出通過仿真世界提供訓練數據,并設計了三層級系統架構:硬件層包含傳感器、控制器和執行器等基礎部件;技能層由多個專門的小模型組成,負責實現自主建圖、導航、物體抓取、開門、移動操作、掛衣服、疊衣服等具體操作;大模型層則承擔任務規劃職責,負責根據指令調用技能層的小模型,并根據執行結果規劃下一步行動。
這種分層架構使大模型負責低頻調用,技能層執行高頻快速操作,既保證了系統的精準性,又提高了響應速度。正如公司創始人王鶴所說,這種設計類似于人類大腦的快慢思考系統,其中快思考系統(小腦)通過小模型處理交互控制和靈巧操作等技能,慢思考系統(大腦)則通過大模型實現認知、理解和規劃能力。
銀河通用選擇從無人值守藥店、商超和物流分揀等場景切入市場。在商業布局上,公司已與美團簽署戰略合作協議,雙方將在線下零售、智慧貨倉、智慧物流等多個領域開展深入合作。后續規劃包括工業、物流、科研、教育以及家庭等應用場景。
盡管目前具身智能場景尚未產生規模化經濟效益,市場對于盈利模式、產品形態、技術路線和應用場景都沒有形成共識,但銀河通用認為這種情況對創業者反而更加有利。銀河通用創始人王鶴表示,如果大家都形成共識了,最后拼的就是成本、資源、人脈,這些要素對于創業者而言是不利的。不過對于技術發展的終極目標,家庭場景應用結合全人形設計和大模型技術已逐漸成為共識,公司也認同家庭應用領域將是人形機器人未來發展的最大舞臺。
站在2024年末,通用機器人行業發展輪廓日漸清晰。我們看到了幾個關鍵趨勢:技術融合正在加速,AI大模型與機器人控制的邊界逐漸模糊;場景落地提速明顯,從實驗室走向真實應用的步伐在加快;商業模式不斷創新,各家都在尋找最適合自己的發展路徑;生態合作持續深化,行業正在形成更開放和多元的發展生態。
同時,行業也面臨著諸多挑戰:成本與性能的平衡始終是一個難題,如何在保證性能的同時實現商業可行性,考驗著每家企業的智慧;通用化能力的提升任重道遠,當前機器人在場景遷移和任務泛化方面還需突破;商業模式仍在探索中,各家正在尋找最優解;行業標準的建設亟待加強,統一的協議標準和安全規范將是推動行業健康發展的重要保障。
根據花旗銀行發布的最新報告預測,到2050年,全球人形機器人數量將達到6.48億臺,市場規模將達7萬億美元,復合年均增長率達到60.7%,顯示出巨大的市場發展潛力。
能在通用具身機器人這場角逐中勝出的玩家,必將是那些能在技術創新、場景落地和商業模式上找到最佳平衡點的企業。
偽再哪里?具身可以讓一個普通人變成小超人[靈光一閃][靈光一閃],技能提升數十倍[捂臉][捂臉][捂臉]
立德機器人平臺是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機器人垂直領域服務平臺