【成果變形記】
酒店里,機器人為你送外賣,隨叫隨到;馬路上,機器人和馬拉松運動員一起跑步,有模有樣;舞臺上,機器人跟隨音樂一起跳舞,動作流暢……如今,機器人越來越多地走進大眾生活。但當(dāng)前大部分機器人做動作都要靠程序員提前編好程序,如何能讓人形機器人真正實現(xiàn)“人在干啥,它就做啥”的功能?
近日,西湖大學(xué)王東林教授團隊發(fā)布了搭載全球首個通用動作預(yù)訓(xùn)練大模型(GAE)身外化身系統(tǒng)的人形機器人泰坦o1——它能隨時、隨地、隨性模仿人類的各種動作,打破地域和距離的限制。
這套通用動作預(yù)訓(xùn)練大模型可理解為團隊給機器人安裝了一個“通用小腦”——大腦管思維,小腦管動作。
人形機器人泰坦o1,是西湖大學(xué)人工智能和機器人領(lǐng)域的第一個優(yōu)質(zhì)成果轉(zhuǎn)化落地項目。
那么,這個機器人,究竟有啥不一樣?
會動,但做不到“隨心而動”
人形機器人的外觀和人類相仿,能走路、拿東西……但你總覺得現(xiàn)有的人形機器人還是不像人類——動作生硬、依賴“套路”,一遇到?jīng)]練過的場景就出錯。
王東林是西湖大學(xué)機器智能實驗室負(fù)責(zé)人,一直在和人形機器人“過招”。“現(xiàn)在的機器人做動作,基本靠程序員提前編好程序,就像咱們背課文一樣,一字不差才能做好。”比如,“彎腰拿杯子”是一套程序,“抬手拿筆”是另一套。要是讓它做個沒編過的動作,比如“邊走路邊擦桌子”,它就會卡殼。這是傳統(tǒng)機器人最大的技術(shù)瓶頸:沒有通用的動作模型,無法舉一反三。王東林介紹。
更麻煩的是,絕大多數(shù)機器人的手腳“各管各的”——下半身走路和上半身操作的系統(tǒng)是分開的。人類走路時伸手接?xùn)|西,不假思索;但機器人做起來,顧此失彼。
反應(yīng)慢也是硬傷。機器人靠大模型先理解指令再生成動作,要花好幾秒鐘“琢磨”,跟不上真實節(jié)奏。地面有點斜坡、濕滑,它更容易踉蹌。
說白了,現(xiàn)在的機器人“會動”,但做不到“隨心而動”。
像照鏡子一樣,毫秒不差
人形機器人泰坦o1項目的辦公地,距離西湖大學(xué)云谷校區(qū)不遠(yuǎn)。一出電梯,記者看到一臺銀黑相間、帶橙色裝飾的機器人在占地近半層樓的試驗場地里“鍛煉”——這就是泰坦o1。
不遠(yuǎn)處,站著一位穿緊身黑色動捕服的工作人員。只見他舒展雙臂,快速轉(zhuǎn)身,再蹲下身。旁邊的泰坦o1,就像照鏡子一樣,毫秒之間就復(fù)刻了所有動作:手臂角度、身體傾斜、膝蓋彎曲,甚至手指的細(xì)微顫動,都一模一樣。
工作人員故意踉蹌了一下,身體往左邊傾斜。泰坦o1瞬間跟上,左腿跨出一步穩(wěn)住身體,右臂反向擺動,穩(wěn)穩(wěn)找回平衡,跟人類調(diào)整平衡的樣子如出一轍。
緊接著,工作人員做起廣播體操,擴胸、體轉(zhuǎn)、彎腰。泰坦o1全程同步,動作標(biāo)準(zhǔn),連節(jié)拍都原樣復(fù)刻。“所有這些動作,并非事前編排好的程序,都是工作人員的隨性而為。任何人穿上動捕服隨意動作,機器人都能跟上,成為他的‘影子’。”王東林說。
泰坦o1的另一項強大功能是:它不僅能當(dāng)“影子”,還能當(dāng)千里之外的“替身”。讓你無論走到天涯海角,只要有網(wǎng)絡(luò),穿上動捕服,就能指揮機器人遠(yuǎn)程辦事。你甚至可以一個人同時遙控幾十臺機器人,讓它們做一樣的動作。
“最棒的是,這臺機器人拿來就能用。你不需要懂技術(shù)、學(xué)編程,甚至不用提前訓(xùn)練。穿上動捕服或打開電腦后臺,你想讓它做什么,它就做什么。”王東林說。
“通用小腦”怎樣煉成
為什么泰坦o1能做到這些?因為它有一顆其他人形機器人沒有的“通用小腦”:通用動作預(yù)訓(xùn)練大模型。
在人體中,小腦負(fù)責(zé)協(xié)調(diào)運動、維持平衡。GAE就是人形機器人的“通用小腦”,能讓機器人在收到信號后瞬間做出最合適的動作。這套原創(chuàng)算法由西湖大學(xué)團隊完全自主研發(fā),比國際上其他團隊的同類技術(shù)領(lǐng)先至少6個月。
“ChatGPT讓AI能理解并生成語言,Seedance能生成視頻畫面,而GAE讓機器人模仿和執(zhí)行各種人類動作,是機器人領(lǐng)域第一個實現(xiàn)動作泛化的大模型。”王東林介紹。
有了這顆“小腦”,機器人能手腳協(xié)同配合,不再“各管各的”;也不用提前編好所有程序,遇到?jīng)]做過的動作都能輕松應(yīng)對。而且,這顆“小腦”還很通用,具備“跨本體”能力——不同結(jié)構(gòu)、不同尺寸的機器人,都能加載這套大模型。
記者了解到,王東林團隊此前已在四足機器人、人形機器人領(lǐng)域深耕多年,積累了豐富的運動控制技術(shù)。同時,他們還擁有全球領(lǐng)先、國內(nèi)最大的高質(zhì)量全身運動數(shù)據(jù)集——包含人類各種日常動作、復(fù)雜動作的詳細(xì)數(shù)據(jù)。正是這些數(shù)據(jù),為泰坦o1的“通用小腦”提供了充足的“學(xué)習(xí)素材”,讓它能精準(zhǔn)模仿人類動作,實現(xiàn)毫秒級同步。
團隊介紹,研發(fā)泰坦o1的初衷,是讓機器人代替人類去做那些危險的工作——比如消防救援、礦區(qū)作業(yè)、高空維修,既能提高效率,也能保護人類安全。
(光明日報記者 晉浩天)