今年爆火的人形機器人,“火”到服貿會上了。在2024年服貿會國家會議中心綜合展區(qū),一家無人值守藥店吸引了不少觀眾駐足圍觀。北京青年報記者在現(xiàn)場看到,藥店“接單”后,找藥、抓藥、遞送等環(huán)節(jié),均由一臺一人來高的人形機器人完成,科技感十足。在這臺機器人的背后,凝聚著北京銀河通用機器人有限公司打破陳規(guī)、彎道超車的大膽嘗試。站在人工智能風口上,這個年輕的初創(chuàng)團隊讓機器人擁抱大模型,使其擁有更智慧的“大腦”、更靈活的“小腦”。而他們的終極夢想,是讓機器人走進千家萬戶,把人們從繁重的家務勞動中解放出來,享受更加美好的生活。
對計算機和人工智能頗感興趣的連續(xù)創(chuàng)業(yè)者朱輝,早在十年前便已涉足機器人產業(yè)。不過那時人工智能大模型尚未出現(xiàn),企業(yè)制造出來的機器人也顯得不夠聰明,“說是智能機器人,我倒覺得更像‘智障’機器人。”朱輝笑稱。
盡管如此,十年來朱輝仍在持續(xù)關注智能機器人產業(yè)。2021年國外一家公司發(fā)布通用機器人計劃,隨后推出首款人形機器人“擎天柱”,標志著人形機器人進入加速產業(yè)化階段。2022年年底,以ChatGPT為代表的大語言模型在全球范圍內受到廣泛關注,人工智能領域實現(xiàn)了一次重要突破。此時朱輝敏銳地意識到,智能機器人的黃金機遇期來了。
朱輝與銀河通用創(chuàng)始團隊早有接觸。得知他們正在籌備組建新公司時,朱輝義無反顧地加入了這個平均年齡不到30歲的年輕初創(chuàng)團隊,再次投身他所熱愛的“智能機器人”賽道。
提起團隊成員,朱輝贊不絕口:“公司創(chuàng)始人之一王鶴本科畢業(yè)于清華大學電子系,后來到斯坦福大學讀了博士,他是國內具身智能領域的領軍人物,也是國際頂尖學者。另一位創(chuàng)始人姚騰洲在機器人行業(yè)也有多年實戰(zhàn)經驗,曾負責多個系列機器人產品的研發(fā)工作,積累了豐富的經驗。他們在專業(yè)技能與產品研發(fā)、商業(yè)化等方面形成優(yōu)勢互補。”
技術“大牛”們描述的智能機器人,更是讓朱輝充滿期待:“他們希望做一款通用人形機器人。一方面表現(xiàn)在‘任務通用’,機器人在執(zhí)行抓取、放置、開柜子、開抽屜、送貨等不同任務時,能夠做到‘言出法隨’,人們讓它做什么,它就能做什么;另一方面表現(xiàn)在‘環(huán)境通用’,機器人能在各種地形和環(huán)境當中自由穿梭,自動感知并適應周圍環(huán)境。這是我十幾年來一直期待的智能機器人應該有的樣子,我相信我們有能力制造出這樣的機器人。”
朱輝在銀河通用的職務是產品總監(jiān)。公司成立初期沒有辦公場地,他便整天泡在咖啡廳里工作。直到在中關村紅極一時的電子產品大賣場——鼎好大廈完成升級改造,朱輝與團隊成員才有了自己的“窩”。朱輝介紹,銀河通用成立于2023年5月,當時正處在人工智能的風口上,公司乘勢而為,依靠大模型,開始推動人形機器人加速“進化”。
“當時擺在我們面前的第一道難題,就是如何讓產品擁有‘泛化能力’。”朱輝介紹,傳統(tǒng)機器人之所以不夠智能,是因為它只能依靠程序員編寫的代碼指令完成規(guī)定動作,“以抓取桌面上的礦泉水為例,程序員要編寫代碼指令告訴機器人桌子的位置、高度,水瓶的顏色、形狀等信息。只要其中任何一個指標發(fā)生變化,這段代碼指令也就失效了。”
必一運動官網
相比之下,大模型可以突破限制,讓機器人具備人的認知和推理能力。朱輝解釋:“雖然杯子的形態(tài)、材質不同,抓杯動作和角度各異,但只要機器人學習得足夠多,就能知道怎樣做。通過海量數(shù)據訓練,機器人就能具備通用性,也就是人們常說的‘泛化能力’。”
理論有了,訓練機器人所需的海量數(shù)據又難住了他們。僅靠真實世界的數(shù)據采集顯然是“杯水車薪”。朱輝說,國外有一家機器人公司曾經使用十多臺設備、花費一年多時間、耗資近兩千萬美元,采集真實世界的數(shù)據。但這種方式不僅成本高昂,且效率低下,最終機器人僅能在經過特定訓練的場景里抓取物品。如果換一個空間,機器人的抓取成功率就會急劇下降。最后,朱輝的同事們通過“合成仿真”技術,幫助機器人跨越了虛擬到現(xiàn)實的鴻溝。
“這項技術不需要真人戴上設備采集數(shù)據,而是依靠合成仿真數(shù)據來訓練機器人。銀河通用自研生成了千萬級場景數(shù)據和十億級的抓取數(shù)據。這些數(shù)據覆蓋了家用電器、工具等物體的操作方式,以及不同材質、形態(tài)、擺放方式的物體。我們在這個虛擬世界里,訓練了機器人多項泛化技能,包括物體抓取、開門開抽屜、晾衣服等。”朱輝說,通過大量的仿真數(shù)據訓練,幫助機器人走進商超和家庭,將科幻小說中的情節(jié)變?yōu)楝F(xiàn)實或許已經不再遙遠。
經過近一年的技術研發(fā)與真機測試,今年夏天銀河通用迎來了“交作業(yè)”的關鍵時刻——公司第一代人形機器人產品“蓋博特(Galbot)”,開始在大型展會上密集亮相,展示實力、拓展市場。
最令朱輝印象深刻的,是6月份的2024北京智源大會,那也是“蓋博特”自落地以來的“首秀”。“參展前一天晚上我?guī)缀鯖]怎么睡,不是緊張,而是充滿期待。我們將成為全球首家可以用真機長時間演示泛化操作能力的具身大模型機器人公司,這是多么令人心潮澎湃的事情!那會兒我的希望就是‘蓋博特’受到市場認可,希望能有更多人了解銀河通用。”
人形機器人“蓋博特”在北京智源大會上一炮而紅,之后又陸續(xù)在兩岸青年交流峰會、世界人工智能大會、世界機器人大會以及正在舉行的服貿會上亮相。每到一處,都會引發(fā)大量關注,這也讓銀河通用團隊越來越自信。他們珍惜每一次“秀肌肉”的機會,“蓋博特”每次亮相也都會比前一次展現(xiàn)出更強大的能力。
朱輝介紹,在北京智源大會上首次亮相時,“蓋伯特”展現(xiàn)出泛化抓取能力,可以抓取桌面上隨機擺放的紙張、飲水瓶、零食等物品,執(zhí)行桌面清理任務;在世界機器人大會上,“蓋伯特”展現(xiàn)了清理桌面、貨架取貨、貨架補貨、抱箱子等四項能力,適應的工作場景也更加豐富,“短短兩個月時間里,我們的人形機器人產品在不斷加速升級。每一次展示都能給觀眾帶來新的驚喜,我覺得特別驕傲。”
參展過程中,朱輝經常與不同領域的從業(yè)者進行交流,這讓他對行業(yè)痛點和市場需求有了更為直觀的了解。在一次展會現(xiàn)場,一名從事制造業(yè)的觀眾來到銀河通用展臺,觀看機器人在應用場景中的工作狀態(tài)。“他說工廠里面有大量枯燥重復的勞動等待機器人去替代,最典型的是‘線邊取料’,物流人員將生產線所需的各種零部件、原材料配送到特定位置,隨后生產線操作人員將這些物料搬到小車上,再運送至生產線進行生產。這項工作枯燥重復,但傳統(tǒng)機器人又無法勝任,因為零件在料箱中是隨機堆疊放置的。我告訴他,像‘蓋博特’這樣有泛化能力的機器人就可以完成這一任務,它能夠感知周圍環(huán)境,自主規(guī)劃移動路徑,在完全陌生的環(huán)境里完成工作。”
展覽現(xiàn)場,“蓋博特”還吸引了不少小朋友的關注。孩子們會熱情地把手中的玩具放到展臺上,等待“蓋博特”抓取,他們覺得這個過程很有趣。這樣的景象也讓朱輝感到欣慰:“人形機器人正處于萌芽期,未來還有很長的路要走。這些小朋友注定會成長為社會的中堅力量,如果我們的機器人在與孩子互動的過程中,能讓他們覺得機器人好玩兒、有趣,從小接觸前沿科技成果,在心里埋下一粒探索的種子,那也是我們的一項成就。說不準將來的某一天,他們就會投身到這個行業(yè)當中,和我們并肩作戰(zhàn),推動具身智能的發(fā)展進步。”
昨日,北青報記者在國家會議中心綜合展區(qū)看到,在一家無人值守藥店內,貨架上擺著近百種藥品,一臺一人來高的機器人正靈活移動。現(xiàn)場觀眾在平板電腦上選擇藥品并“下單”后,機器人便會按需求在貨架上尋找藥品。鎖定目標后,機器人抬起右臂,“吸盤手”瞬間把藥盒“吸”起來。轉身、移動,機器人最終回到展臺,把藥品遞給觀眾……整個過程科技感十足。
北青報記者了解到,服貿會現(xiàn)場展示的這臺人形機器人正是銀河通用的第一代產品“蓋博特”。銀河通用機器人產品總監(jiān)朱輝介紹說,這臺人形機器人可以完成取藥、補藥、理貨等一系列動作,是“硬件本體+小腦+大腦”的集大成者,并且展現(xiàn)出更聰慧的“大腦”,更靈活的“小腦”。
“在多模態(tài)大模型技術賦能下,我們給人形機器人裝上了‘大腦’,可以理解人類自然語言,并根據語言指令與人類交互。”朱輝介紹,當人們對機器人說“我渴了”的時候,機器人首先調動大腦大模型,理解這句話的含意。“‘我渴了’意味著‘想喝水’,然后觀察周圍環(huán)境,判斷哪個物品是可以喝的,在多種物品中進行精準識別。找到合適的物品后,機器人調動‘小腦大模型’,完成移動、抓取等動作。”
據介紹,在大小腦模型的聯(lián)動下,“蓋博特”已可以理解人類自然語言并根據語言指令與人類交互。朱輝透露,預計今年年底,人形機器人“蓋博特”將應用到真實的藥店等場景中,實現(xiàn)藥店夜間場景的無人值守和藥品訂單的機器人取送。
朱輝:目前全球最熱的產業(yè),非人形機器人莫屬。隨著大模型橫空出世,人形機器人作為一個重要的關鍵詞頻繁出現(xiàn)在我國的重要產業(yè)規(guī)劃藍圖中。人工智能賦能各行各業(yè),推動產業(yè)創(chuàng)新與升級,正在引領第四次工業(yè)革命,全球寄予它開辟一個前所未有新世界的期待。當下,大模型加機械軀殼的人形機器人站在了前排,引發(fā)公眾的高度關注。
人形機器人是先進制造業(yè)的集大成者,其產業(yè)發(fā)展將會帶動機械、電子、傳感、軟件、通信、人工智能等高端產業(yè)共同進步。智能控制的嵌入式計算方法、傳感器技術的突破不僅能帶動人形機器人產業(yè)的發(fā)展,還能給其他行業(yè)帶來經濟效益。隨著人形機器人代替流水線上的工人,進入農業(yè)、建筑等領域,有業(yè)內專家估計,未來大約30%的工業(yè)場景將被重新定義,這將大大推動生產力躍升。
朱輝:機器人一定要有勝任力,也就是說,它一定要在場景里干活兒。過去一年里,我們利用合成數(shù)據對機器人的三項基本技能——抓取、放置、導航進行逐一攻克,讓機器人具備更強的學習能力、對復雜場景的感知與理解能力,學會“舉一反三”,使機器人能夠自主移動并執(zhí)行拾取和放置任務。
如今,我們正率先在零售場景里實現(xiàn)全場景的閉環(huán),機器人進入場景后能自主探索貨架,把貨架上所有的商品完成建圖識別,整個過程自動部署、自動取貨、自動交給顧客。我們把這個場景做好,就實現(xiàn)了“從0到1”的突破。下一步我們還將朝著“從1到100”的目標邁進,輻射更多行業(yè)。
朱輝:永遠不要對短期科技的爆炸產生過高的期待,但也不要忽略遠期科技的成長將會帶來的巨變。人形機器人在今天還處于萌芽期,在未來三到五年的時間內,人們可能會在一系列應用場景里看到它。
人形機器人最終的目標是“通用”,取代我們現(xiàn)在只能做一件事情的專用機器人,實現(xiàn)多任務、柔性的操作。未來,打造出員工型機器人,真正對制造業(yè)和勞動力市場進行革命性的推動。我們預計,未來五年,銀河通用的智能機器人將廣泛應用在商超、車場等場景中,承擔貨物配送、線邊取料等任務,用新質生產力為企業(yè)賦予新動能。
在我看來,制造人形機器人的最終夢想是應用于家庭,幫助人們拿水、晾衣等,解放家務勞動。家庭場景的復雜程度更高,目前,執(zhí)行這些任務所需的各項技能正在訓練當中。預計未來五到十年,機器人將有望真正走進百姓家庭。
人民網北京9月15日電 (記者黃盛)近日舉辦的2024年中國國際服務貿易交易會(以下簡稱“服貿會”),“新”意十足。本屆服貿會突出新質生產力特征,展示了數(shù)字文旅、智慧教育、智能體育等新服務、新場景,突出了以生活性服務貿易激發(fā)服務消費潛能,展示出全球服務業(yè)的數(shù)字化、智能化轉型趨勢,推動全球服務貿易在開放中深化合作。…
人民網北京9月15日電 (記者何旭)“大語言模型”加速開發(fā)、科學化規(guī)范化應用有序推進、用戶習慣逐漸養(yǎng)成……在近日舉辦的2024年中國國際服務貿易交易會(以下簡稱“服貿會”)上,教育服務展區(qū)人頭攢動,前來咨詢的人絡繹不絕。 “人工智能(AI)+教育”發(fā)展現(xiàn)狀如何,還有哪些難點需要突破,未來呈現(xiàn)怎樣的趨勢?參展業(yè)界人士表示,人工智能在教育領域的應用,正在影響教學模式的優(yōu)化,培養(yǎng)創(chuàng)新型人才,擴大國際教育交流圈。…
人民日報社概況關于人民網報社招聘招聘英才廣告服務合作加盟供稿服務數(shù)據服務網站聲明網站律師信息保護聯(lián)系我們
人 民 網 股 份 有 限 公 司 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用
必一運動官網