無論是斯坦福Mobile ALOHA、DeepMind機器人技術三大進展,還是Figure 01機器人,都相繼引爆社交媒體,將“機器人”在網絡上的曝光度和討論聲量推上新高度。
只見機器人,一手鍋一手鏟,將去骨雞腿肉煎至兩面金黃,再加入干貝增香調味,并燜煮收汁,最后靈魂蔥花一撒,一道誘人的干貝燒雞就做好啦?。ㄊ裁磿r候才能擁有能聞到味的手機,在線等挺饞的)
必一運動官網
它不僅能炒菜,還能“收拾戰場”,洗鍋擦桌、整理櫥柜全都得心應手,并且業務范圍也不困于廚房的三寸之地,目光所及之處“全是活”。
一時間,不少網友為之驚艷,表示“眼里有活的機器人終于來了!”(讓家長看見,不僅比不過叉燒,這回連機器人也比不過了)
研究論文中表示,Mobile ALOHA是一個低成本的移動操作平臺,由移動基座、雙手操作系統、傳感器和攝像頭組成,可以搜集機器人運動控制數據并加以訓練。
研究團隊發現,通過監督學習方法,Mobile ALOHA在觀看人類示范同一個任務50次后,,就可以在復雜環境中學會移動操控任務,完成如叫電梯、開柜門等操作,成功率可高達90%。
Mobile ALOHA采用全模塊化和開源設計,整體硬件成本只有32000美元(約合人民幣22萬元),其中移動平臺成本只有7000美元,并配備14kg的電池供電,使機器人可以自主移動;而在“大腦”方面,英特爾RTX3070Ti芯片就足以支撐其運算。這相比許多專業機器人平臺具有顯著的價格優勢,研究門檻大幅降低。
在視頻爆火后,研究團隊“自行打臉”,放出“翻車”視頻,澄清Mobile ALOHA并非全知全能,目前還有很多能力需要人類遠程操控,視頻中的很多“極限操作“也是采用混合模式。
在Zhao放出失敗集錦后,在鼓勵大家關注原論文的同時也表示:“這可能是我迄今為止最喜歡的視頻”,也有網友表示認同:“還怪可愛的!”(暫時不用擔心被取代啦)
Mobile ALOHA視頻一出,確實給了不少人震撼,讓人感慨機器人的自動化已經發展到如此精細的程度,但它的“混動”其實也在意料之中。
一是依照現有技術,想讓機器人完成如此復雜的完全自主運作,還需時日;而是主創團隊也壓根沒想瞞的,只要細心一點就能發現,在不少鏡頭都出現了人工操控的身影,視頻結尾也有出現機器人駕駛員的說明。
但很明顯絕大多數人都被機器人前面的炫技吸引,沒有將目光落到最后的細節,更不會去看項目網站和原論文。
英偉達科學家Jim Fan也在平臺發文:我們距離擁有完全自主的機器人廚師或女仆還很遙遠,但我對這項新研究依然感到振奮!
在Mobile ALOHA發布同日,DeepMind從數據采集、決策速度、泛化能力方面,祭出三大研究進展“隔空對打”。
撿水果、從抽屜拿出可樂、擺牙刷……讓機器人達成這些操作的是一個自動化數據收集系統AutoRT,以及加速決策速度的新模型SARA-RT。
研究人員花費7個月時間,利用AutoRT系統控制機器人完成任務,已經收集了涵蓋7000次試驗和6650個獨特任務的多樣化數據,可同時控制最多52臺機器人,讓機器人操作速度提高14%、準確度上升10.6%。
此外,還有一個主打泛化能力的新框架RT-Trajectory,通過解釋機器人的具體動作,來幫助其深入理解如何完成一個任務,而不僅是簡單匹配指令和動作,能讓機器人面對41項從未見過的任務時,成功率高達63%。
在推出一系列重要系統進展的同時,谷歌DeepMind團隊還起草了世界上第一部面向智能機器人的憲法。
其靈感來源于科幻小說家阿西莫夫的“機器人三定律”,主要核心是確保機器人不傷害人類。DeepMind為LLM模型設置了護欄,確保其生成的任務建議不涉及人類、動物、尖銳物品等不安全內容,同時編程限制機器人關節,并添加控制的物理開關。
之前圍繞著AI倫理的討論多集中在算法本身是否存在偏見等問題上,很少涉及AI尤其是具有物理形態的智能機器人應該遵循哪些道德規范。
首部機器人憲法體現了技術應該為人類服務的理念,而非單純追求功能、效率。雖然作為第一步的嘗試,這部機器人憲法還較為簡單和原則,如何使其擁有更嚴密的邏輯體系,如何覆蓋各種情形和倫理,還需要廣泛討論和不斷完善。
但人類文明進步史,是一個不斷學習、探索、犯錯、修正的過程,當我們站在技術發展的新階段,既然已經邁出第一步,其影響力就絕不會限于技術層面。
號稱要做世界上第一臺商業上可行的通用機器人的Figure,在去年先后完成共計7900萬美元的融資(約合人民幣566萬元),股東陣容更是包括英偉達等明星企業。
繼去年10月的初亮相后,Figure 01這次不“蹣跚踱步”了,而是煮起了咖啡!
Figure 01配備了端到端的AI系統,主要觀看10小時人類煮咖啡的視頻,就能完全自主地完成打開機蓋、放入咖啡、按下沖泡按鈕等步驟,中途遇到問題還會自我調試優化。
公司創始人表示視頻速度沒有經過任何加速,那這么看來Figure 01的操作速度和流暢程度還是十分可觀的,甚至可以說令人驚喜。
若之后具備了強大的泛化能力,Figure 01能通過視頻演示實現快速遷移學習,讓機器人擺脫傳統的編程模式,轉向大數據和AI實現自主控制,極大優化人機交互。
伴隨著AI技術熱度的持續升騰,人形機器人和通用機器人成為行業新風口,不僅眾多高玩下場入局,國家也出臺政策強勢撐腰,儼然已成為機圈的新一代“流量王”。
據高盛預測,未來10至15年,機器人市場空間至少達60億美元,而在最理想情況下,預計2035年機器人市場空間有望達1540億美元。
然即便潛力在前,也奮力狂追,但憑現今的技術與市場,機器人離“走進千家萬戶”的目標差得不止一兩步。
但Mobile ALOHA、DeepMind和Figure的最新成果,也為機器人行業提振了不少信心,讓“機器人元年”也顯得更加未來可期了一點。當這些先進技術,真正從實驗室落到實地,融入生活,或許我們才將迎來真正的“機器人元年”。