色中文字幕在线_国产精品美女久久_狠狠久久_懂色av蜜臀av粉嫩av分享吧_一级片a级片_欧美精品 在线观看

熱門標(biāo)簽-網(wǎng)站地圖-注冊-登陸-手機版-投稿 3D打印網(wǎng),中國3D打印行業(yè)門戶網(wǎng)!
當(dāng)前位置:主頁 > 機器人 > 正文

清華趙明國:智能人形機器人≠智能+人形 | 智者訪談

時間:2024-11-05 13:43 來源:機器之心 作者:admin 閱讀:

原創(chuàng) 聞菲 機器之心

人工智能的卓越發(fā)展

源于對技術(shù)與產(chǎn)業(yè)本質(zhì)的洞察

機器之心視頻欄目「智者訪談」

邀請領(lǐng)域?qū)<遥聪ず诵内厔?

深化行業(yè)認(rèn)知,激發(fā)創(chuàng)新思考

與智者同行,共創(chuàng) AI 未來

     2024 年,人形機器人領(lǐng)域迎來爆發(fā)式增長。眾多初創(chuàng)公司異軍突起,以及包括在內(nèi)學(xué)術(shù)界的不斷創(chuàng)新,共同描繪出一幅激動人心的未來圖景。 技術(shù)進步的浪潮固然令人振奮,但保持清醒和冷靜,在開放探索的基礎(chǔ)上,審慎選擇最符合時代需求和技術(shù)發(fā)展規(guī)律的路徑,才是引領(lǐng)人形機器人走向成熟的關(guān)鍵。本期機器之心《智者訪談》邀請到清華大學(xué)自動化系研究員、機器人控制實驗室主任趙明國教授,從運動控制的視角看人形機器人發(fā)展。趙明國教授在機器人控制領(lǐng)域有二十多年的研究與實踐,他認(rèn)為當(dāng)前人形機器人領(lǐng)域呈現(xiàn)出如春秋戰(zhàn)國般多元化的發(fā)展態(tài)勢,這既是蓬勃發(fā)展的象征,也潛藏著方向迷失的風(fēng)險。

      趙明國教授強調(diào),「智能人形機器人」不能只是「智能」和「人形機器人」的簡單疊加,而應(yīng)當(dāng)是一個全新的研究主題和技術(shù)范疇,需要機器人學(xué)和人工智能兩個領(lǐng)域更深層次的融合,制造能夠在復(fù)雜環(huán)境中自主適應(yīng)和學(xué)習(xí)的智能體。

        對大模型技術(shù)在機器人控制領(lǐng)域的應(yīng)用,趙教授認(rèn)為單純依賴「大腦」解決運動控制問題并不合理。人類的運動控制是一個復(fù)雜的多層次系統(tǒng),涉及本體反射、中樞控制和大腦控制等多個層面。我們需要更深入地研究生物系統(tǒng)的運動控制機理,重新思考機器人控制系統(tǒng)的架構(gòu),并探索更有效的學(xué)習(xí)和優(yōu)化方法。

趙教授主張技術(shù)的先進性并不等同于實用性,只有與時代需求和經(jīng)濟發(fā)展相匹配的技術(shù),才能真正落地生根,開花結(jié)果。例如,維納控制論中的很多思想因為過于超前而未能對早期的計算機和人工智能起到重大的推動作用。

那么,究竟什么樣的技術(shù)路線才能最終勝出?人形機器人的未來又將如何演變?點擊觀看視頻,讓我們一同探索。

時間戳

00:47

人形機器人多元發(fā)展現(xiàn)狀

02:47

智能人形機器人≠智能+人形

08:33

雙足運動控制難點

15:49

學(xué)習(xí) VS 優(yōu)化

20:21

用大模型解決運動控制:不合理

29:36

智能機器人控制系統(tǒng)發(fā)展方向

31:30

人形機器人應(yīng)用

訪談文字整理

機器之心:趙明國教授好,非常高興您做客機器之心的《智者訪談》。近年來,隨著具身智能和大語言模型的迅速發(fā)展,公眾對于如何實現(xiàn)智能機器人的討論熱度空前。今天我們很高興能與您從運動控制的視角探討人形機器人的發(fā)展前景。

談及人形機器人,人們往往會聯(lián)想到幾家著名企業(yè),比如專注于機器人運動控制和硬件設(shè)計的波士頓動力,以及憑借在人工智能和大數(shù)據(jù)方面的優(yōu)勢進軍人形機器人領(lǐng)域的特斯拉。

趙明國:事實上,在波士頓動力之前,日本本田公司就已經(jīng)在人形機器人領(lǐng)域做出了開創(chuàng)性的貢獻。波士頓動力主要專注于提升機器人的運動控制能力,而特斯拉則依托其在自動駕駛技術(shù)和先進器件方面的優(yōu)勢,更多從制造業(yè)和供應(yīng)鏈的角度切入,為人形機器人的發(fā)展帶來了全新的思路。這種方法讓許多人認(rèn)為,如果未來機器人要實現(xiàn)大規(guī)模應(yīng)用,特斯拉的路線可能更符合當(dāng)前技術(shù)發(fā)展的趨勢,因此也有不少企業(yè)選擇追隨特斯拉的發(fā)展路徑。

然而,這并不意味著波士頓動力或本田的技術(shù)路線就失去了重要性。我認(rèn)為這些不同路線都有其價值,因為技術(shù)的進步是一個漸進的過程,需要一代又一代的積累和發(fā)展。除了企業(yè)的努力,學(xué)術(shù)界也在不斷提出新的理論和方法。目前,許多公司,包括一些創(chuàng)業(yè)團隊,正在嘗試將學(xué)術(shù)界的研究成果與本田、波士頓動力和特斯拉等公司的技術(shù)應(yīng)用相結(jié)合,探索新的發(fā)展方向。

當(dāng)前人形機器人領(lǐng)域的發(fā)展?fàn)顩r,可以比作春秋戰(zhàn)國時期,雖然存在幾個主流的技術(shù)路線,但更多呈現(xiàn)出百花齊放的局面。

01、白馬非馬:智能人形機器人不只是

智能與人形機器人的簡單疊加

機器之心:眾所周知,運動控制是建立在明確的運動學(xué)和力學(xué)原理基礎(chǔ)之上,在數(shù)學(xué)和工程方面具有嚴(yán)謹(jǐn)性。相比之下,人工智能具備自適應(yīng)和自學(xué)習(xí)能力,尤其在處理復(fù)雜問題時,AI 常能發(fā)現(xiàn)人類難以想到的解決方案。然而,這種特性也帶來了可解釋性的挑戰(zhàn)。

波士頓動力的機器人在運動控制方面表現(xiàn)卓越,同時也展現(xiàn)了高度的智能。例如,配備機械臂的 Spot 機器人在物體識別和抓取方面表現(xiàn)出色。另一方面,以 AI 技術(shù)見長的特斯拉在硬件領(lǐng)域也投入了大量資源。您一直強調(diào)將運動控制與人工智能相結(jié)合的重要性,在發(fā)展人形機器人方面,我們可以從這些公司的實踐中獲得哪些啟示?

趙明國:人形機器人與人工智能的結(jié)合可以采取多種方式。其中一種是兩個領(lǐng)域各自發(fā)展,然后將各自的優(yōu)勢整合。但除此之外,還存在其他途徑。以波士頓動力為例,他們曾強調(diào)專注于運動控制而不涉足人工智能,但實際上他們也運用了一些智能的方法。不過,他們的核心在于解決運動控制問題,如行走、奔跑和跳躍等,只不過在解決這些問題時,他們采用的方法可以是傳統(tǒng)的運動控制技術(shù),也可以是智能的方法。

同樣,專注于人工智能的公司在解決智能問題時,也會使用機器人作為載體。例如,進行對話交互時,可以選擇人形機器人,也可以選擇智能音箱,這對智能本身的影響并不顯著,核心問題在于能否實現(xiàn)順暢的人機交互。

然而,要將人工智能與人形機器人真正深度融合,就像「白馬非馬」這個哲學(xué)命題一樣,需要創(chuàng)造出一個全新的事物。智能人形機器人必然不同于傳統(tǒng)意義上的智能系統(tǒng),也不同于常規(guī)的人形機器人,而是一個更深層次融合后的獨立存在。

我認(rèn)為「具身智能」這個概念較為貼合這種場景。在這種情況下,我們期望機器人能展現(xiàn)出行為層面的智能,不僅能夠在各種復(fù)雜地形上行走,還能在面對干擾時完成任務(wù),表現(xiàn)出智能化的行為。例如,機器人應(yīng)該能夠避開障礙物,在動態(tài)環(huán)境中規(guī)劃路徑,比如開門這個典型案例,包括應(yīng)對不同形狀、不同類型的門,同時能制定策略繞過中間的障礙物,或者在有其他人同時開門時做出規(guī)避或讓步等行為。在手部操作方面,這樣的例子更為豐富,因為人類大部分操作都是通過手來完成的。

這是一個全新的研究主題——如何讓機器人展現(xiàn)智能。這需要機器人學(xué)和人工智能兩個領(lǐng)域進行更深層次的融合,而不僅僅是一個領(lǐng)域借用另一個領(lǐng)域的技術(shù)來提升自身。我們需要將兩者有機結(jié)合,創(chuàng)造出一個全新的技術(shù)范疇。

機器之心:您的觀點非常具有啟發(fā)性,但似乎目前很少有人從這個角度來探討這個問題。

趙明國:這實際上取決于不同的視角,我只是試圖將問題闡述得更加清晰。無論采用何種方法,要開發(fā)出這種新型機器人,我們需要考慮幾個關(guān)鍵。

首先是腿部的智能;其次是手部的智能,包括手指和手臂的智能,手臂負(fù)責(zé)運動,手指負(fù)責(zé)實際的抓取和操作。在進行手部操作時,腿部通常也在運動,這需要手足協(xié)調(diào)。除此之外,還有一些全身性的智能,如騎自行車、攀巖,以及前面提到的開門,這些活動強調(diào)全身的協(xié)調(diào)。從運動能力的角度來看,有些智能機器人可能更側(cè)重于腿部功能,有些更注重手部功能,還有一些可能側(cè)重全身運動,也可能是這三個領(lǐng)域的不同組合。

在早期階段,我認(rèn)為可以為這三個領(lǐng)域分別選取一些典型案例作為代表,用它們來推動技術(shù)發(fā)展,并作為標(biāo)準(zhǔn)測試平臺。如果一個機器人能夠完成特定任務(wù),就意味著相關(guān)技術(shù)已經(jīng)取得突破,能夠?qū)崿F(xiàn)某些功能了。我們可以從一個領(lǐng)域開始,逐步擴展到兩個,最終實現(xiàn)三個領(lǐng)域的突破,然后再考慮實際應(yīng)用。

當(dāng)然,也有團隊選擇直接從應(yīng)用需求出發(fā),通過反向推導(dǎo)來進行開發(fā)。目前業(yè)界還沒有形成共識,各種方法都有人在嘗試。但從最基本的邏輯看,無非就是這三個領(lǐng)域的不同組合。

02、雙足運動控制難點:

學(xué)習(xí)與優(yōu)化的結(jié)合

機器之心:您在仿人機器人雙足步態(tài)控制領(lǐng)域擁有 20 余年的研究實踐和經(jīng)驗,見證了技術(shù)的幾代變遷。雙足控制一直是機器人研究中的一個難點,您認(rèn)為目前該領(lǐng)域面臨的主要技術(shù)瓶頸是什么?

趙明國:這個領(lǐng)域確實經(jīng)歷了一個漫長的發(fā)展過程。傳統(tǒng)上,研究者傾向于從仿生角度來解決這個問題,但由于仿生機理尚未完全掌握,最初出現(xiàn)的是一些簡化模型。這些模型雖與人體某些運動相關(guān),但并不完全相同,它們借鑒了人體生理學(xué)的某些特征,如倒立擺模型。這些簡化模型雖然維度較低,但在當(dāng)時的計算機水平下能夠?qū)崟r完成計算,因此在那個時期是較為有效的選擇。

我們現(xiàn)在使用的許多方法,如模型預(yù)測控制(Model-Predictive Control,MPC)和全身控制(Whole-Body Control,WBC),都源自上世紀(jì)。我認(rèn)為真正的突破在于 MPC,它引入了對未來進行預(yù)測這一非常重要的概念。這一點在人工智能領(lǐng)域也很重要,即基于某些知識對未來進行預(yù)測,兩個領(lǐng)域在這一點上是共通的。

近期,由于強化學(xué)習(xí)的突破,我們能夠在仿真環(huán)境中進行強化學(xué)習(xí),然后將獲得的策略遷移到實體機器人上。這一路徑已被證明是可行的,我認(rèn)為這是一個相當(dāng)重要的貢獻。現(xiàn)在通過強化學(xué)習(xí)方法,大多數(shù)初創(chuàng)團隊能在幾個月內(nèi)讓機器人完成多種復(fù)雜任務(wù),比如運動恢復(fù)和粗糙地面行走,這些任務(wù)在過去需要大量時間和資源才能攻克。

目前的仿真技術(shù)能夠支持大部分運動學(xué)和動力學(xué)的仿真。然而,對于視覺和其他多種傳感器的仿真,還無法達到與人類感知相媲美的真實程度。對環(huán)境的仿真,尤其是彈性物體的仿真,仍有待改進。如果這些方面能夠得到顯著提升,這些工具將大大加速整個研發(fā)過程。

就人形機器人而言,如果僅關(guān)注運動能力,數(shù)據(jù)獲取可能不是特別困難,或者說運動類數(shù)據(jù)具有其特殊性。我個人認(rèn)為,小規(guī)模數(shù)據(jù)集可能已經(jīng)足夠。但現(xiàn)在面臨的挑戰(zhàn)是,究竟需要什么樣的小規(guī)模數(shù)據(jù)集?這個問題每個研究者的看法都不盡相同,我認(rèn)為這在很大程度上取決于具體的任務(wù)需求。

2024 年初引發(fā)廣泛關(guān)注的 Mobile ALOHA 項目,沒有使用仿真,而是通過遙操作來獲取真實場景數(shù)據(jù),直接解決了對齊和許多中間環(huán)節(jié)的技術(shù)問題。在這個方向上,研究者會開發(fā)出多種方法來快速有效地獲取數(shù)據(jù),這是一個非常明確的發(fā)展趨勢。

另一種可能的方向是利用積累的大量視頻資源。如果能直接從視頻中獲得機器人運動控制所需的數(shù)據(jù),將會是非常有價值的。舉例來說,中學(xué)生學(xué)習(xí)打籃球時,很多人會模仿喬丹或科比,他們通過觀看視頻來學(xué)習(xí),盡管喬丹和科比并未親自指導(dǎo)他們,他們也沒有這些球星的任何詳細數(shù)據(jù)。然而,由于機器的能力水平還無法像人類那樣從視頻中學(xué)習(xí),我們不得不通過仿真或遙操作來獲取數(shù)據(jù)。不過,對于完成人形機器人的某些復(fù)雜運動來說,遙操作方法可能與完成簡單任務(wù)(如刷盤子)還有所不同,需要綜合考慮視覺等多個方面。

機器之心:您提到機器的能力還無法像人類那樣從視頻中學(xué)習(xí),具體是指哪些能力呢?

趙明國:我主要指的是處理數(shù)據(jù)的能力。目前,機器的視覺分析能力還不足以從單目相機拍攝的普通視頻中直接分析出人的準(zhǔn)確三維坐標(biāo),或者將其轉(zhuǎn)換為所需的數(shù)據(jù)格式。

在人形機器人領(lǐng)域,目前的重點依然是從仿真中獲取數(shù)據(jù)。在仿真的潛力沒有被完全挖掘或達到瓶頸之前,研究者肯定會集中精力在仿真方面深入探索。但是,當(dāng)任務(wù)發(fā)生變化時,仿真的局限性就會顯現(xiàn)出來,而目前又無法直接從視頻中獲取所需的數(shù)據(jù)。在這種情況下,像 Mobile ALOHA 使用的方法就非常巧妙,因為它解決了數(shù)據(jù)獲取的難題。然而,如果要讓機器人完成諸如踢足球、打籃球或攀巖等復(fù)雜運動,遙操作的方法可能就不太適用了。隨著研究的不斷深入,我相信還會出現(xiàn)許多新的技術(shù)手段,最終很可能會發(fā)展到能夠直接利用視頻數(shù)據(jù)。

體育院校積累了大量運動數(shù)據(jù),如何有效利用這些數(shù)據(jù)也是一個值得探討的問題。我認(rèn)為這在很大程度上受到數(shù)據(jù)采集和分析手段以及算法的影響。但最終的核心問題仍然是如何獲得高質(zhì)量的數(shù)據(jù),以及如何有效利用這些數(shù)據(jù)。這兩個問題都在不斷發(fā)展,但核心邏輯仍然是進行學(xué)習(xí)和訓(xùn)練,獲取數(shù)據(jù),然后利用數(shù)據(jù)進行訓(xùn)練,這兩個基本步驟沒有改變,但在具體實施細節(jié)上會發(fā)生許多技術(shù)上的變革。目前,技術(shù)發(fā)展速度非常快,甚至在一周之內(nèi)就可能產(chǎn)生一些新的突破性結(jié)果。

機器之心:您曾提到過工程師在面對數(shù)據(jù)問題時的思維方式——數(shù)據(jù)不足就增加傳感器,成本受限就減少傳感器,這與傳統(tǒng) AI 研究人員的思考方式有很大不同。

趙明國:傳統(tǒng)上,運動控制主要依賴于確定性的控制方法,與人工智能的關(guān)聯(lián)并不緊密。然而,當(dāng)機器人被置于動態(tài)環(huán)境中時,單純的控制方法往往難以應(yīng)對復(fù)雜情況。例如,在線的傳統(tǒng)控制方法可能不符合生物系統(tǒng)的某些特性。在這種情況下,一個可能的解決方案是引入人工智能,或?qū)⑷斯ぶ悄芘c控制方法相結(jié)合。盡管如此,具體的融合方式仍有待探索。

傳統(tǒng)上,我們習(xí)慣將系統(tǒng)劃分為規(guī)劃、感知和控制等幾個模塊。近來,端到端網(wǎng)絡(luò)逐漸流行,這種方法可能實現(xiàn)我們所需的效果。然而,端到端方法下,系統(tǒng)的內(nèi)部結(jié)構(gòu)可能與我們常規(guī)認(rèn)知中的模塊劃分不同。盡管它可能依舊包含類似規(guī)劃、感知、控制的功能,但其劃分方式可能與傳統(tǒng)方法大相徑庭。我認(rèn)為不應(yīng)強求 AI 系統(tǒng)的內(nèi)部結(jié)構(gòu)必須符合傳統(tǒng)認(rèn)知或經(jīng)驗,關(guān)鍵在于它能否有效地解決問題。

我們正處于一個關(guān)鍵的技術(shù)變革時期,眾多新的技術(shù)和方法正在誕生。這些新事物的最終形態(tài)以及哪些會得到廣泛認(rèn)可和普及,目前尚難定論。但可以肯定,一些新的關(guān)于機器人控制系統(tǒng)的結(jié)構(gòu)必將出現(xiàn)。這可能需要一個交互式的學(xué)習(xí)過程:一方面,機器在不斷學(xué)習(xí)和進化;另一方面,人類也在觀察和學(xué)習(xí)機器如何解決問題。我們需要學(xué)習(xí)總結(jié)機器的這些方法,并將其提升到方法論的層面,這很可能是一個反復(fù)迭代的過程。

然而,有一點是比較明確的:如果要在傳統(tǒng)方法的基礎(chǔ)上實現(xiàn)突破,你會發(fā)現(xiàn)傳統(tǒng)方法已經(jīng)充分利用了可獲得的信息。許多現(xiàn)有的解決方案已被證明是最優(yōu)的,如果不引入更多的傳感器,本質(zhì)上很難超越原有方法的效果,因為這些方法已經(jīng)達到了極致,并無明顯缺陷。除非你改變了問題的定義,在這種情況下,你并非是將原問題解決得更好,而是改變了問題本身。

機器之心:這意味著評判標(biāo)準(zhǔn)都發(fā)生了變化。

趙明國:確實如此。許多頂級期刊也在討論優(yōu)化控制與學(xué)習(xí)方法產(chǎn)生的效果之間的差異。結(jié)論表明,在某一個確定的問題上,學(xué)習(xí)的方法并不會比優(yōu)化方法更好,因為優(yōu)化是針對一個它可以解決的目標(biāo),它一定是做得最好或者最好的之一,但是學(xué)習(xí)可以構(gòu)建一個比它更好的優(yōu)化問題。

對于優(yōu)化方法而言,你必須明確定義成本函數(shù)和約束條件,而且這些條件必須滿足特定要求才能求解,因此優(yōu)化方法的適用范圍相對有限。相比之下,學(xué)習(xí)方法所能學(xué)到的策略范圍更為廣泛。

我認(rèn)為硬件本身應(yīng)該引入更多的傳感器。我常舉的一個典型例子是按開關(guān)。在整個過程的前期階段,這個動作主要依賴視覺,視覺在相當(dāng)長的一段時間內(nèi)占據(jù)重要地位。但當(dāng)接近開關(guān)時,即使視覺精確到 0.1 毫米也無濟于事,此時主要依賴的是觸覺。當(dāng)觸覺將開關(guān)按到一定程度后,觸覺的重要性也隨之降低。最終判斷開關(guān)是否啟動,可能需要依靠聽覺(聽到開關(guān)的聲響),同時還需要視覺確認(rèn)燈光的變化。需要指出,這里所需的視覺能力是對光線瞬間變化的感知,與之前在軌跡規(guī)劃過程中使用的視覺能力有所不同。

因此,對于按開關(guān)這樣一個看似簡單的任務(wù),在整個過程中,涉及各種不同的感官信號,而且其權(quán)重是動態(tài)變化的。開始階段主要依賴運動和視覺,中間階段更多依賴觸覺,最后階段則可能綜合運用聽覺和另一種形式的視覺感知。這種動態(tài)權(quán)重分配的機制與人工智能領(lǐng)域的注意力機制有一定相似之處。

目前的控制方法難以處理如此復(fù)雜的邏輯。雖然 Transformer 等模型在某種程度上實現(xiàn)了類似的機制,但它們能否在機器人控制領(lǐng)域同樣發(fā)揮這種作用仍存疑問,這是因為人類的實際操作與機器人的操作之間存在本質(zhì)差異。

目前大多數(shù)機器人系統(tǒng)實現(xiàn)的動作都只是對人類一些基本動作的模擬,而且模擬的范圍還比較有限。像 ALOHA 這樣的系統(tǒng)很可能是在視覺層面模仿了人類動作的前半部分,在最后階段還難以做到精確控制。這也是為什么某些看似簡單的任務(wù),比如疊衣服,實際上非常具有挑戰(zhàn)性,因為它不僅需要視覺信息,還需要觸覺和其他感官輸入。此外,還需要對「什么狀態(tài)下衣服算是疊好了」有準(zhǔn)確的認(rèn)知。僅僅依靠手上的攝像頭是無法獲取所有這些必要信息的。

當(dāng)前的技術(shù)發(fā)展主要聚焦于初級階段,因為仍有 90% 的廣闊領(lǐng)域和眾多新興領(lǐng)域尚待開發(fā)。但隨著研究深入和產(chǎn)業(yè)發(fā)展,最后那 5% 的難點會變得至關(guān)重要。我相信這些硬骨頭問題終將浮出水面,而研究人員將逐一解決。不過,諸如刺繡等精細操作,或者將金屬加工到極致精密的程度,需要投入更多的精力和成本,但在實際應(yīng)用中不會立即產(chǎn)生顯著回報。因此,短期內(nèi)這些問題不會特別受關(guān)注。然而,一旦主流技術(shù)領(lǐng)域發(fā)展遇到瓶頸,這些精細化的問題可能迅速成為研究熱點,并有可能引發(fā)新一輪的技術(shù)突破。

03、用「大腦」解決運動控制并不合理

機器之心:大模型的出現(xiàn)引發(fā)了人工智能界的極大熱情,特別是使用 Transformer 架構(gòu)統(tǒng)一表示文本、音頻和圖像等不同模態(tài)的數(shù)據(jù)。這種統(tǒng)一框架的思路是否也適用于人形機器人?例如,是否有可能將疊衣服、洗碗、切菜、炒菜等日常任務(wù),以及跑步、踢足球、跨欄、跑酷等運動技能,都整合到一個統(tǒng)一的框架中進行訓(xùn)練?

趙明國:人工智能,尤其是大語言模型和視覺模型,更多是在解決類似于大腦中的思考問題,在邏輯分析和認(rèn)知規(guī)劃方面表現(xiàn)出色。雖然將這種邏輯應(yīng)用于運動控制確實可以解決一些問題,但根據(jù)我們對生物學(xué)和控制理論的理解,這種方法并不完全適用,也無法全面覆蓋。

舉例來說,大語言模型基于預(yù)先規(guī)劃所有步驟然后執(zhí)行的邏輯,這實際上是控制領(lǐng)域上一代的思路。早期的仿生學(xué)將仿生系統(tǒng)劃分為感知、反饋、規(guī)劃和決策幾個部分。然而,現(xiàn)代生理學(xué)研究表明,生物的神經(jīng)系統(tǒng)在運動控制上具有復(fù)雜的層次結(jié)構(gòu),而目前的大語言模型并未充分反映這一點。

我認(rèn)為,運動控制可能需要一套獨有的結(jié)構(gòu):從硬件層面看,控制頻率極高,需要信號處理和控制領(lǐng)域的專業(yè)知識支持;中間層次,如小腦,其頻率處于中等水平;而大腦的多模態(tài)認(rèn)知部分頻率相對較慢。如何有效地結(jié)合這三個層次是一個復(fù)雜的問題。簡單地將它們拼接在一起是不恰當(dāng)?shù)摹S腥颂岢鍪褂靡粋大模型模擬大腦,再用另一個大模型模擬小腦,我認(rèn)為這種方法過于簡單化。

人類的神經(jīng)系統(tǒng)及其他靈長類動物的神經(jīng)系統(tǒng)都不是這樣構(gòu)建的。如果只通過大腦來控制,效率必然低下。人類的運動控制包括本體反射、中樞控制和大腦控制,而且大部分運動更多依賴于本體和中樞。盡管我們對這方面的認(rèn)知仍然有限,但基于現(xiàn)有知識,很難認(rèn)為僅靠大腦模型就能很好地完成所有任務(wù)。因此,在神經(jīng)系統(tǒng)的仿生領(lǐng)域或控制系統(tǒng)架構(gòu)方面,未來可能會出現(xiàn)更先進的理論或模型,這是非常值得期待的。

作為一名機器人研究者,我特別不希望看到機器人技術(shù)被完全否定,而將所有工作都轉(zhuǎn)移到人工智能領(lǐng)域。這樣做不僅無法促進機器人技術(shù)本身的發(fā)展,最終結(jié)果也不會令人滿意。如果人工智能技術(shù)僅僅是滲透到機器人領(lǐng)域,推動機器人產(chǎn)業(yè)發(fā)展,但機器人行業(yè)本身的模式不發(fā)生變化,這對機器人領(lǐng)域來說并非好消息。從產(chǎn)業(yè)角度來看,這實際上是一種降級。

要實現(xiàn)真正的升級,機器人領(lǐng)域應(yīng)該結(jié)合人工智能的發(fā)展,將其作為一種新的模式,同時提高自身的技術(shù)水平,進行升級換代,使其與人工智能的發(fā)展相匹配。只有這樣,才能產(chǎn)生理想的效果,機器人領(lǐng)域的專家才能為人形機器人的發(fā)展做出真正的貢獻。

04、智能機器人控制系統(tǒng)發(fā)展方向

機器之心:在構(gòu)建智能機器人時,我們需要同時考慮底層的運動控制和上層的規(guī)劃與決策。您認(rèn)為應(yīng)如何權(quán)衡這兩者?

趙明國:現(xiàn)有的技術(shù)往往機械地將運動控制和認(rèn)知決策劃分為底層和上層兩部分。從機器人研究的角度來看,我們知道人體的神經(jīng)系統(tǒng)分為大腦、小腦和脊髓三個主要部分,這三部分具有截然不同的功能,并且有明確的功能分區(qū)。

大腦不僅包含運動神經(jīng)系統(tǒng),還有負(fù)責(zé)整個神經(jīng)系統(tǒng)訓(xùn)練的學(xué)習(xí)功能區(qū)。例如,像走路這樣的日常動作,實際上并不需要大腦的直接參與。人體在脊髓中有一個稱為中樞神經(jīng)的部分,構(gòu)成了中樞神經(jīng)系統(tǒng)。這個系統(tǒng)通過各個關(guān)節(jié)之間的震蕩和相互激勵,完成走路等節(jié)律性運動。

這些節(jié)律性運動甚至不需要小腦的大量參與,在脊髓層面就可以完成,而且控制效果相當(dāng)出色。然而,當(dāng)遇到路面障礙物時,視覺系統(tǒng)就需要介入。視覺信號會激發(fā)控制系統(tǒng),引導(dǎo)身體繞開障礙物。生物體能夠很好地解決這種既能產(chǎn)生節(jié)律性運動,又能產(chǎn)生非節(jié)律性受控運動的復(fù)雜任務(wù),而現(xiàn)有的機器人系統(tǒng)尚未具備這種能力。我們要么是針對節(jié)律性運動進行訓(xùn)練,要么針對非節(jié)律性運動進行訓(xùn)練,而且通常以大腦的參與為主,對真實生物系統(tǒng)中的整合過程是完全缺失的。

例如本體反射,當(dāng)你被火燙到時,感覺系統(tǒng)會立即感知到高溫,這種感覺通過脊髓迅速傳遞給相應(yīng)的肌肉,導(dǎo)致肌肉立即收縮。肌肉收縮的信號又刺激到相應(yīng)的關(guān)節(jié),使手臂迅速縮回。這種反射不需要經(jīng)過大腦,動作非常迅速且協(xié)調(diào)。換言之,在大腦意識到之前,你的手就已經(jīng)本能地做出了反應(yīng)。當(dāng)然,最初的反應(yīng)可能是朝火源靠近,但經(jīng)過生物進化,最終形成了遠離危險源的反應(yīng)。隨后,這個信號會繼續(xù)傳遞到小腦和大腦。大腦意識到燙傷后,如果附近有水源,會指揮手部進行有目的的運動,比如將手浸入水中。這種動作既不屬于本體反射,也不是節(jié)律性運動,而是大腦發(fā)出的有意識決策。

人體經(jīng)過漫長的進化,形成了自己獨特的機制。目前我們對人體生物系統(tǒng)的模擬還很片面,往往是分別模擬各個部分的功能,然后試圖將它們整合在一起,這就導(dǎo)致了整體效果顯得生硬且難以協(xié)調(diào)。我認(rèn)為,如果能更多地向仿生方向靠攏,依據(jù)生理學(xué)原理來設(shè)計控制系統(tǒng),可能會有所突破。然而,這需要生理學(xué)專家能夠更清晰地闡釋這些機制,然后我們按照這些原理去實現(xiàn),這本身就是一個極具挑戰(zhàn)性的任務(wù)。即便機制被完全闡明,實現(xiàn)起來也并非易事。

機器之心:包括機器人的傳感器設(shè)計也是一個重大挑戰(zhàn)。

趙明國:確實如此,傳感器的設(shè)計也不一定能完全按照人體的方式來實現(xiàn)。我個人傾向于認(rèn)為,工程師應(yīng)該把握最基本的機理。首先,有一條上行的信號通道,信號從末梢傳感器向上傳遞到脊髓、小腦和大腦,這個過程需要一定的時間延遲,形成一個動態(tài)系統(tǒng)。其次,有一條下行的信號通道,信號在神經(jīng)系統(tǒng)做出決策后向下傳遞,這同樣是一個動力學(xué)系統(tǒng),兩條信號通道都存在一定的時間延遲。同時,相鄰的神經(jīng)系統(tǒng)需要形成局部的回路,包括脊髓回路、小腦回路和大腦回路。這三個回路的特征在目前的控制系統(tǒng)中很少得到完整體現(xiàn)。

不過,隨著人工智能和神經(jīng)網(wǎng)絡(luò)技術(shù)的進步,以及硬件設(shè)備的發(fā)展,有可能出現(xiàn)更符合仿生特點的系統(tǒng)。目前有許多研究,如類腦控制、類腦 SLAM 等,都在嘗試這一方向。雖然這些方法并沒有完全按照生物系統(tǒng)的原貌去實現(xiàn),但它們把握了核心機理,可以利用現(xiàn)有的電子和機電器件,按照信號處理的方式重新構(gòu)建整個系統(tǒng),實現(xiàn)全新的架構(gòu)。我認(rèn)為在仿生這個方向上還有很大的創(chuàng)新空間,從長遠來看,在仿生領(lǐng)域繼續(xù)深入研究是很有價值的。

機器之心:這個方向與具身智能結(jié)合起來,應(yīng)該能夠開拓出廣闊的研究空間。

趙明國:沒錯,這可以作為具身智能研究的一個分支,因為智能本身就包含仿生的方向。我們可以按照現(xiàn)有的技術(shù)路線繼續(xù)深入研究,將細節(jié)做得更加深入和透徹。但是,單純依靠堆積數(shù)據(jù)和算力是否就足夠了?只要能夠取得很好的結(jié)果,這種方法也并非不可行。我認(rèn)為研究人員可以從不同角度展開研究,而不是片面否定或過度依賴某一種方法。這就像從不同角度登山,最終都有可能到達山頂。

05、關(guān)于人形機器人應(yīng)用:

除了替代人,還可以有第二種思路

機器之心:關(guān)于人形機器人,目前還沒有明確的應(yīng)用場景。您認(rèn)為哪些領(lǐng)域或者行業(yè)可能率先看到人形機器人走向?qū)嶋H應(yīng)用?

趙明國:人形機器人應(yīng)用場景的話題其實已經(jīng)討論多年了。不過,我們要區(qū)分愿景和現(xiàn)實。就像手機電池,理想情況下大家當(dāng)然希望不需要充電,但實際購買時還是要考慮成本等多種因素。現(xiàn)在討論人形機器人的時候,很多人沒有明確區(qū)分愿景和現(xiàn)實。

就應(yīng)用場景而言,我認(rèn)為可能包括工廠、養(yǎng)老、家庭服務(wù)、餐飲、接待、危險作業(yè)等。但目前還沒有哪個場景能夠保證立即實現(xiàn)。大家普遍的思路是用機器人替代人類完成現(xiàn)有工作,這自然是必要的。但除此之外,如果人形機器人能夠創(chuàng)造新的應(yīng)用場景,包括那些原本不被重視或并非剛需的場景,因為人形機器人的出現(xiàn)而成為可能,我認(rèn)為這對人形機器人的發(fā)展可能會起到關(guān)鍵作用。

實際上,這個問題可以分為科學(xué)問題、技術(shù)問題、產(chǎn)品問題和商品問題。人形機器人可能還處于技術(shù)問題甚至科學(xué)問題階段,很多基礎(chǔ)的問題仍未解決,比如我們前面談過的智能控制系統(tǒng)架構(gòu)究竟如何實現(xiàn),技術(shù)還在不停演變和發(fā)展,有些問題的解決方案相對明顯,但大多數(shù)還不明朗,大家都在嘗試的過程中。

這時候討論技術(shù)路線該如何實現(xiàn),是使用 A 路線 B 路線還是 C 路線,或者很多人已經(jīng)做到商品化,要大規(guī)模賣。我覺得我們還處于混沌的狀況。

機器之心:在機器人的發(fā)展歷程中,您能舉例說明技術(shù)和應(yīng)用場景是如何相互影響的嗎?

趙明國:電機就是一個很好的例子。早期機器人使用的電機與現(xiàn)在有很大不同,例如在 ASIMO 那個時代,典型的電機是空心杯,火星車也用的是空心杯電機,它形狀細長,效率很高,占用空間小。隨著機器人技術(shù)向更高精度、更復(fù)雜控制和更高性能的發(fā)展,空心杯電機逐漸被無刷直流電機等類型所取代。

電機的設(shè)計也在不斷變化。例如永磁力矩電機,以前是內(nèi)轉(zhuǎn)子的,現(xiàn)在用外轉(zhuǎn)子,因為后者氣息更大,力鉅密度更大,對人形機器人這種移動體來說更實用,而且它還可以把關(guān)節(jié)做到扁平。這種電機最近幾年很多人在做,但其實這些種類早就有,只是應(yīng)用領(lǐng)域不一樣。外轉(zhuǎn)子電機最早用于四旋翼飛行器,后來被應(yīng)用到人形機器人上,大家突然發(fā)現(xiàn),這其實是明擺著的道理,就應(yīng)該這樣。

這就是技術(shù)和產(chǎn)業(yè)相匹配的結(jié)果,大家會找到一個平衡點。傳感器和驅(qū)動器也在朝著高度集成的方向發(fā)展。這背后有經(jīng)濟規(guī)律支持,產(chǎn)業(yè)需求和技術(shù)在特定時間點一定是匹配的,誰匹配得好,誰就能獲得發(fā)展,匹配不上的就得不到發(fā)展。

這一點在計算機領(lǐng)域的體現(xiàn)更為明顯。馮諾依曼架構(gòu)之所以長期主導(dǎo),很大程度上是因為它作為一種線性結(jié)構(gòu),最容易大規(guī)模生產(chǎn),尤其在當(dāng)時生產(chǎn)制造水平較低的情況下。雖然現(xiàn)在也有很多新的架構(gòu)出現(xiàn),但要完全取代馮諾依曼架構(gòu)依舊困難。

機器人領(lǐng)域目前也處于百花齊放的階段,要實現(xiàn)大一統(tǒng),讓大家公認(rèn)某一條路線還很難,但可以肯定的是:誰迎合了社會的需求、生產(chǎn)力的需求,誰就能勝出,而非基于主觀愿望,比如「我認(rèn)為未來人形機器人能進工廠,能進家庭」,但并不是大家都認(rèn)可現(xiàn)在做就一定能夠成功。

我覺得這取決于市場,國家政策也可能起到推動作用,但技術(shù)的突破存在不確定性,科學(xué)家也無法保證只要給我多少條件,就一定能把技術(shù)突破。

有的認(rèn)知,可能是在形成的過程中,先把戰(zhàn)術(shù)做起來,最后才會形成戰(zhàn)略,并不是說先把所有戰(zhàn)略都想清楚了。但是,這背后一定是有規(guī)律的。我個人覺得一方面要勇于實干,在市場上積極嘗試,另一方面,如果明顯在邏輯上有漏洞的東西,可能就少做,或者重要性別放那么高,優(yōu)先做的一定是你認(rèn)為更符合邏輯,或者是更容易實現(xiàn)的。這跟時間點也有關(guān),比如說現(xiàn)在大數(shù)據(jù)、大算力,如今市場環(huán)境這些更容易獲得,在這上面投入自然更容易出成果。

但這時候如果你非要從事仿生,可能最終仿生就是正確的,但仿生學(xué)在 20 年以后勝利,并不意味著現(xiàn)在做仿生就能取得成功,現(xiàn)在從事仿生學(xué)研究可能連經(jīng)費都拿不到,更不用說做出典型案例了。歷史上有一個很好的例子,維納在 MIT 找了兩個年輕人,由于計算機最終采用了馮諾依曼架構(gòu)而非他們的方案,這兩個年輕人都郁郁而終,三十幾歲就去世了,對此維納也無能為力。

這并非他們的想法有問題,回過頭看,你會發(fā)現(xiàn)如今很多概念,比如具身智能、存算一體,智能控制等,維納在《控制論》中都有提及,除了控制論,他的思想還啟發(fā)了信息論、系統(tǒng)論。

機器之心:我在《維納傳》里有讀到,確實令人惋惜,時代沒有準(zhǔn)備好。

趙明國:沒錯,關(guān)鍵在于時間點不對,太過超前了,當(dāng)時的技術(shù)無法支撐,或者說社會還沒有相應(yīng)的需要,因此無法產(chǎn)生經(jīng)濟效益。并不是說這些想法從科學(xué)角度看存在問題,而是從應(yīng)用角度看,它們還不適合當(dāng)時的環(huán)境。我認(rèn)為可以從不同視角來看。以維納為例,在科學(xué)方面,他毫無疑問是頂級大師,但在產(chǎn)業(yè)方面,維納對產(chǎn)業(yè)有啟發(fā)和引領(lǐng)作用,但他并非實踐者。相比之下,馮諾依曼在這兩方面都有極高造詣,他未必沒有認(rèn)識到維納的這些想法,只是他選擇了更能產(chǎn)生實際應(yīng)用的方案。

機器之心:現(xiàn)在仿生學(xué)的時代沒有到,您認(rèn)為其中的關(guān)鍵原因是什么?

趙明國:我覺得主要有兩方面,一是對生物機理的認(rèn)知尚不充分,二是相關(guān)器件的水平尚未達到要求。仿生學(xué)高度依賴物理器件和傳感器的水平。當(dāng)前,我們可以進行仿生學(xué)研究,但不應(yīng)拘泥于完全仿生。現(xiàn)階段的工程實踐可以沿用堆積算力、數(shù)據(jù)等資源的思路,這是可行的,我也不質(zhì)疑。不過,我們也可以適度融入一些仿生學(xué)的思想,因為生物經(jīng)過長期自然進化,其結(jié)構(gòu)和功能必然有其合理性和優(yōu)勢。我們要持續(xù)深化對這些特性的認(rèn)知。

就現(xiàn)有的技術(shù)手段而言,我認(rèn)為應(yīng)該循序漸進。人形機器人是一個長遠目標(biāo)。不能否認(rèn),這是人類的終極目標(biāo)之一。無論是具體的工作還是智能本身,都是我們最終需要解決的問題。但當(dāng)前能做什么,這是一個技術(shù)問題。從現(xiàn)實出發(fā),我的建議是:大型企業(yè)和國家隊需要攻克這些難題,朝著最終目標(biāo)邁進。要進入工業(yè)應(yīng)用場景,就需要組建合適的團隊。這種大型團隊能夠在長期內(nèi)持續(xù)進行復(fù)雜的規(guī)模化的系統(tǒng)性研究。

對于較小的團隊,很難在整個系統(tǒng)層面開展復(fù)雜的研究。他們可以選擇純學(xué)術(shù),或者鉆研具體的問題。例如,可以聚焦某個科學(xué)問題或工程問題,比如改進電機、優(yōu)化傳感器,或者革新算法。一旦取得突破,大型團隊就可以將這些成果整合到他們的系統(tǒng)中發(fā)揮重要作用。我認(rèn)為小型團隊沒有必要執(zhí)著于解決工廠機器人或家庭機器人這些宏大課題,甚至說立即將產(chǎn)品推向市場,這可能不符合邏輯。

技術(shù)的發(fā)展不能脫離社會經(jīng)濟的發(fā)展。技術(shù)先進并不意味著一定要立即應(yīng)用,只要技術(shù)符合當(dāng)前需求,就可以投入使用。至于哪種技術(shù)能夠得到更廣泛的應(yīng)用,取決于總體效益,這與經(jīng)濟規(guī)律有關(guān),也可能與人的認(rèn)知水平有關(guān)。歷史上,由于某個時期人類認(rèn)知的局限,可能會犯一些局部性錯誤,這種情況并不罕見。但從長遠看,更先進的技術(shù)終將勝出,這符合歷史進步的規(guī)律。

嘉賓簡介

趙明國,清華大學(xué)自動化系研究員、機器人控制實驗室主任、清華大學(xué)無人系統(tǒng)中心類腦機器人中心主任。發(fā)表百余篇論文,授權(quán)國家發(fā)明專利 10 余項。在人形機器人領(lǐng)域,提出了虛擬斜坡行走方法、廣義模型預(yù)測控制、全身控制等方法,研究成果獲得 RoboCup 人形組亞軍等多項國際獎項。在類腦計算領(lǐng)域,利用神經(jīng)形態(tài)技術(shù)創(chuàng)建了高性能、高能效的機器人控制系統(tǒng),成果發(fā)表于 Nature 封面,獲得 2019 年度中國科學(xué)十大進展及「科技創(chuàng)新 2030」計劃的資助。

(責(zé)任編輯:admin)

weixin
推薦內(nèi)容
評論
發(fā)表評論
請自覺遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動的言論。
評價:
主站蜘蛛池模板: 亚洲国产精品久久久久久 | 国产女人爽到高潮免费视频 | 午夜欧美| 中文字幕av高清 | 国产精品日韩在线 | 黄色免费在线观看 | 九九99 | 日韩欧美一区二区视频 | 久久国产一区二区三区 | 91av导航| 久久成人免费观看 | 一区二区三区日韩 | 亚洲成人国产精品 | 欧美videosex性欧美黑吊 | 伊人网视频 | 自拍视频在线播放 | 国产激情精品一区二区三区 | 三级欧美在线观看 | 一区视频在线 | 亚洲第一区国产精品 | 探花在线观看 | 欧美一区二区三区精品 | 久久久久久久99精品免费观看 | 可以在线观看的av网站 | 午夜精品在线 | 精品一区二区在线观看 | 国产精品成人久久久久 | 日本一区不卡 | 这里只有精品视频 | 亚洲二区在线播放 | 久久中文字幕一区二区三区 | 国产成人精品一区二 | 久久久久久久久99精品 | 欧美视频区 | 天堂精品 | 日韩电影专区 | 国产精品jizz在线观看麻豆 | 中文av一区 | 91网址| 国产精品美女久久久久久久久久久 | 干干干操操操 |