最近,由中國移動具身智能產(chǎn)業(yè)創(chuàng)新中心打造的機(jī)器人大家族在各大展會成為了萬眾矚目的焦點,吸引眾多科技愛好者駐足圍觀。這些充滿未來科技感的造物背后,是中國移動具身智能產(chǎn)業(yè)創(chuàng)新中心在機(jī)器人大腦技術(shù)上的突破,在交互、移動、操作、學(xué)習(xí)等領(lǐng)域提升自主化水平,將機(jī)器人從重復(fù)操作的機(jī)械工具搖身一變成貼心的智能伙伴。
自主交互:機(jī)器人的 “聊天進(jìn)化史”
機(jī)器人聊天,你能想象嗎?自主交互給予了機(jī)器人這項神奇技能。
基礎(chǔ)交互階段(L0-L2):僅能理解并執(zhí)行結(jié)構(gòu)化的簡單指令,例如"開燈"、"播放音樂"等明確指令。它們的行為完全依賴于預(yù)設(shè)程序,缺乏靈活應(yīng)對能力。
智能交互階段(L3):具備更強(qiáng)大的理解能力。當(dāng)被詢問"昨天的快遞放在哪里"時,機(jī)器人能夠自主檢索記憶系統(tǒng),快速給出準(zhǔn)確回答。更值得注意的是,它們開始具備初步的情感識別能力,可以通過分析用戶的語氣和表情來判斷情緒狀態(tài)并主動提供相應(yīng)反饋。
高級交互階段(L4-L5):這是機(jī)器人交互技術(shù)的未來發(fā)展方向。處于這個階段的機(jī)器人將成為真正的"對話專家",不僅能夠主動發(fā)起話題,還能與其他機(jī)器人進(jìn)行默契配合,實現(xiàn)群體智能。
當(dāng)前,得益于大語言模型技術(shù)的突破性進(jìn)展,多數(shù)家用機(jī)器人的交互能力在智商方已達(dá)到L3水平,具備基礎(chǔ)的世界知識理解和信息檢索生成能力。然而在情感智能方面仍處于L1-L2的初級階段,對于人類復(fù)雜情感和潛臺詞的理解能力仍有待提升,這是未來技術(shù)突破的重點方向。
中國移動具身智能產(chǎn)業(yè)創(chuàng)新中心研發(fā)的機(jī)器人目前已具備較強(qiáng)的多模態(tài)交互能力,能夠理解復(fù)雜指令并識別人類手勢動作,然而,在更高級的人機(jī)對話自然度和復(fù)雜場景適應(yīng)能力方面,仍存在進(jìn)一步優(yōu)化的空間。對比國際前沿技術(shù),美國Figure公司開發(fā)的機(jī)器人已經(jīng)實現(xiàn)了通過自然語言指令完成物品分揀等精細(xì)操作;國內(nèi)創(chuàng)新企業(yè)如宇樹科技、蔚藍(lán)科技等也在積極推進(jìn)自主交互技術(shù)的研發(fā),通過深度學(xué)習(xí)和大語言模型的應(yīng)用,不斷提升機(jī)器人的交互智能水平。
手眼腦協(xié)同泛化操作:機(jī)器人的 “職場蛻變記”
手眼腦協(xié)同泛化操作指的是機(jī)器人在沒有人類直接操控的情況下,獨立感知、理解并完成任務(wù)的能力。這項能力的演進(jìn)可以分為三個重要發(fā)展階段:
程序控制階段(L0-L1):完全依賴預(yù)設(shè)程序運(yùn)行,其行為模式固定且缺乏應(yīng)變能力。工業(yè)流水線的清潔機(jī)器人,它們只能按照既定程序完成重復(fù)性工作,一旦作業(yè)環(huán)境發(fā)生變化或出現(xiàn)意外情況,便容易陷入操作困境。
環(huán)境適應(yīng)階段(L2-L3):獲得環(huán)境感知能力和初步學(xué)習(xí)能力,能夠通過視覺系統(tǒng)識別周圍物體,自主調(diào)整操作策略以適應(yīng)物品位置的變化。在家庭場景中,它們已經(jīng)可以完成諸如傾倒液體、物品分類等需要一定靈活性的任務(wù)。
泛化自主階段(L4):這是機(jī)器人泛化操作的最高發(fā)展階段。達(dá)到該水平的機(jī)器人具備強(qiáng)大的環(huán)境理解和任務(wù)遷移能力,能夠應(yīng)對開放環(huán)境中的各種復(fù)雜情況。無論是處理陌生對象還是適應(yīng)全新場景,都能游刃有余。想象一下,未來的家庭機(jī)器人可以像專業(yè)管家一樣,獨立完成烹飪、清潔等系列家務(wù),真正實現(xiàn)智能化服務(wù)。
當(dāng)前,多模態(tài)大模型的技術(shù)突破正在加速具身智能的發(fā)展。Physical Intelligence公司推出的PI-0機(jī)器人已接近L3水平,能夠執(zhí)行廚房清潔等任務(wù),但在處理遮擋物和特殊物品時仍需人工輔助。中國移動具身智能創(chuàng)新中心的家庭服務(wù)機(jī)器人已實現(xiàn)多項突破:具備家居任務(wù)智能規(guī)劃能力、標(biāo)準(zhǔn)物品識別抓取功能、1cm級精密操作技術(shù),并通過模仿學(xué)習(xí)掌握了"倒牛奶"等精細(xì)動作,整體達(dá)到L2.4水平。中心正集中力量研發(fā)新一代具身智能大模型,計劃在2025年實現(xiàn)L3.0級別的操作能力,以應(yīng)對更復(fù)雜的服務(wù)場景和更具挑戰(zhàn)性的任務(wù)需求。
自主移動:機(jī)器人的 “自由行走夢”
自主移動對于機(jī)器人來說,就如同人類的 “腿腳”,從 “需要牽著走” 到 “想去哪就去哪”。
基礎(chǔ)移動階段(L0-L1):機(jī)器人完全依賴人工遠(yuǎn)程操控,其移動能力相當(dāng)于"學(xué)步兒童"。一旦脫離操作者的實時控制,就會立即失去方向感和行動能力,無法自主應(yīng)對環(huán)境變化。
自主移動階段(L2 - L3):機(jī)器人有了點 “獨立意識”,能自主跟隨主人、避開障礙物。以中心自研的四足機(jī)器狗為例,能夠?qū)崿F(xiàn)室內(nèi)自主導(dǎo)航、跟隨主人以及避障等功能。但在樓梯、戶外復(fù)雜地形等更具挑戰(zhàn)性的環(huán)境中,仍需人工監(jiān)督確保安全。
完全自主階段(L4-L5):這是機(jī)器人移動技術(shù)的終極目標(biāo)。達(dá)到此階段的機(jī)器人行動自如,能在開放環(huán)境中自主規(guī)劃路線,甚至能根據(jù)天氣變化等復(fù)雜因素自主調(diào)整移動策略,真正實現(xiàn)全自動移動。
中國移動具身智能產(chǎn)業(yè)創(chuàng)新中心研發(fā)的四足機(jī)器人已實現(xiàn)室內(nèi)自主導(dǎo)航(L2產(chǎn)品級,L3演示級)。國內(nèi)領(lǐng)先企業(yè)如宇樹科技、云深處開發(fā)的機(jī)器狗也已在室內(nèi)環(huán)境中展現(xiàn)出良好的移動能力,但在戶外復(fù)雜場景的應(yīng)用仍處于測試優(yōu)化階段。這標(biāo)志著我國在機(jī)器人自主移動技術(shù)領(lǐng)域已取得重要進(jìn)展,但距離完全自主的終極目標(biāo)仍有提升空間。
自主學(xué)習(xí):機(jī)器人的 “大腦升級之路”
自主學(xué)習(xí)是機(jī)器人不斷提升自我的 “大腦訓(xùn)練”,其發(fā)展過程展現(xiàn)了從程序控制到自主決策的質(zhì)變。
基礎(chǔ)學(xué)習(xí)階段(L0-L2):只能按照人類編寫的程序做事,缺乏靈活性。比如掃地機(jī)器人按固定路線清掃,遇到新的障礙物無法調(diào)整路線。
優(yōu)化學(xué)習(xí)階段(L3):開始具備通過實踐經(jīng)驗優(yōu)化行為的能力。就能通過 “練習(xí)” 優(yōu)化動作的能力。比如,四足機(jī)器人在摔倒后可以自主調(diào)整姿態(tài)恢復(fù)平衡,輪式機(jī)器人能夠根據(jù)用戶的使用習(xí)慣不斷優(yōu)化移動路徑。
高級認(rèn)知階段(L4-L5):這是機(jī)器人學(xué)習(xí)能力的最高發(fā)展階段。達(dá)到此階段的機(jī)器人將擁有人類般的類比推理能力,可以通過環(huán)境觀察自主掌握新技能,甚至可能發(fā)現(xiàn)超出人類預(yù)設(shè)的創(chuàng)新解決方案。
現(xiàn)在,除了在仿真環(huán)境和大模型微調(diào)訓(xùn)練中的用到的強(qiáng)化學(xué)習(xí),針對實體機(jī)器人的自主學(xué)習(xí)技術(shù)仍處于探索階段,大多數(shù)機(jī)器人處于 L0 - L1 階段,中國移動具身智能產(chǎn)業(yè)創(chuàng)新中心的機(jī)器人能通過模仿學(xué)習(xí)抓取不同物品,工業(yè)機(jī)器人能根據(jù)產(chǎn)線變化調(diào)整動作,但在復(fù)雜場景下的自主決策能力仍在研發(fā)中。
四個自主“小伙伴”的默契大作戰(zhàn)
想象一下,你家里有個超厲害的機(jī)器人小伙伴。你跟它說 “倒杯牛奶”,它憑借自主交互(L3)聽懂了你的話;接著用自主移動(L2)開開心心地走到廚房;到了廚房,靠自主作業(yè)(L2.4)精準(zhǔn)地拿起杯子,倒入牛奶;未來它還通過自主學(xué)習(xí)記住了你喜歡喝溫牛奶的習(xí)慣,下次再給你倒牛奶的時候,就能做得又快又好,它們緊密配合,才讓機(jī)器人從 “笨手笨腳的機(jī)器” 變成了超貼心的 “生活小助手”。
結(jié)語
中國移動具身智能產(chǎn)業(yè)創(chuàng)新中心用“四個自主”技術(shù)定義機(jī)器人的邊界——智能機(jī)器人不再是冷冰冰的機(jī)器,而是能思考、會學(xué)習(xí)、懂情感的“生活伙伴”。從技術(shù)發(fā)展路徑來看,當(dāng)前全球機(jī)器人技術(shù)正處于關(guān)鍵轉(zhuǎn)折期:國際領(lǐng)先企業(yè)已實現(xiàn)L3級自主能力的商業(yè)化落地,但距離真正意義上的L4-L5級完全自主仍有約十年的技術(shù)突破期。值得關(guān)注的是,中國企業(yè)在特定場景應(yīng)用方面已實現(xiàn)與國際并跑,但在核心算法、關(guān)鍵硬件等基礎(chǔ)領(lǐng)域仍需持續(xù)突破。展望未來,隨著"四個自主"技術(shù)的持續(xù)演進(jìn),機(jī)器人會成為生活、工作中的 “超級助手”,在更多領(lǐng)域發(fā)揮作用,為人類社會創(chuàng)造更多意想不到的價值和可能。
作者:
程耀 中國移動智慧家庭運(yùn)營中心具身智能產(chǎn)業(yè)創(chuàng)新中心技術(shù)管理經(jīng)理
趙永生 中國移動智慧家庭運(yùn)營中心具身智能產(chǎn)業(yè)創(chuàng)新中心技術(shù)管理經(jīng)理
黃雨祺 中國移動智慧家庭運(yùn)營中心具身智能產(chǎn)業(yè)創(chuàng)新中心用戶運(yùn)營經(jīng)理
張馨心 中國移動智慧家庭運(yùn)營中心具身智能產(chǎn)業(yè)創(chuàng)新中心運(yùn)營支撐經(jīng)理
高晗 中國移動智慧家庭運(yùn)營中心具身智能產(chǎn)業(yè)創(chuàng)新中心算法研發(fā)
審核:
程寶平,中國移動首席專家、中國移動智慧家庭運(yùn)營中心具身智能產(chǎn)業(yè)創(chuàng)新中心總經(jīng)理
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。