複製鏈接
請複製以下鏈接發送給好友

具身智能

鎖定
具身智能是人工智能的一個發展領域,指一種智能系統或機器能夠通過感知和交互與環境進行實時互動的能力。可以簡單理解為各種不同形態的機器人,讓它們在真實的物理環境下執行各種各樣的任務,來完成人工智能的進化過程。 [1] 
具身智能機器人是“具身智能”的實體形態,有望成為AI的最終載體。其整體架構由感知層、交互層、運動層組成。“具身智能”最大的特質就是能夠以主人公的視角去自主感知物理世界,用擬人化的思維路徑去學習,從而做出人類期待的行為反饋,而不是被動的等待數據投餵。 [2] 
人形機器人提供了各種基於人類行為的學習和反饋系統,為實現更復雜行為語義提供了迭代的基礎和試驗場。因此,人形機器人的逐步完善也為具身智能的落地提供了方向,是具身智能的重要應用場景,也將為具身智能的迭代優化提供方向和空間。 [3] 
中文名
具身智能
外文名
Embodied AI
所屬學科
人工智能
特    質
以主人公的視角去自主感知物理世界

具身智能誕生背景

達特茅斯會議之後的一段時期內,對人工智能的研究主要限於符號處理範式(符號主義)。符號主義的侷限性很快在實際應用中暴露出來,並催動了聯接主義的發展,形成了包括多層感知機、前向神經網絡、循環神經網絡,直至今日風靡學術界與產業界的深度神經網絡等多種方法。這種用人工神經網絡模擬認知過程的方法在適應、泛化與學習方面的確取得了很大的進展,但並未真正解決智能體與真實物理世界交互的難題針對以上問題,“具身智能”(Embodied AI)概念應運而生。 [1] 

具身智能發展歷史

1950年,在圖靈論文《Computing Machinery and Intelligence》中具身智能被首次提出。
1986年,布魯克斯從控制論角度出發,強調智能是具身化(Embodied)和情境化 (Contextlized)的,傳統以表徵為核心的經典AI進化路徑是錯誤的,而清除表徵的方式就是製造基於行為的機器人。《How the Body Shapes the Way We Think》中通過分析“身體是如何影響智能的”對“智能的具身化”做了清晰的描述,這些工作為人工智能的第三個流派——以具身智能為代表的行為主義方法奠定了基礎。 [1] 
2023年,2023半導體大會上,英偉達創始人黃仁勳表示具身智能(Embodied AI)是能理解、推理、並與物理世界互動的智能系統,是人工智能的下一個浪潮。 [2] 
2024年3月17日,OpenAI與人形機器人初創公司Figure合作推出了Figure 01機器人。一段長達2分35秒的視頻展示了Figure 01驚人的理解、判斷、行動和自我評估能力。 [4] 
2024年3月23日,2024全球開發者先鋒大會開幕式上,上海市副市長陳杰表示,將加強核心技術的突破,推動智能芯片關鍵技術和應用適配,打造更多元開放的智能計算生態,支持通用大模型和垂直大模型的研發,積極推進大模型和具身智能的融合發展。 [5] 

具身智能理論支持

根據具身智能的技術實現邏輯,“知”是建立在“行”之上的,只有通過“具身”才能理解某個場景。甲骨文等古老漢字,絕大多數就是通過行為的表徵來刻畫一個概念,比如“爭”的古老寫法中,代表兩個人的手拔一根繩子,因此,理解行為才是理解概念及場景的關鍵。 [1] 
具身的概念是可檢驗、可測量的。人所理解的世界概念,其中既包括人類獨有的責任心、榮譽、感情、慾望等非具身的概念,也包括了杯子、車等實體以及相應行為的具身概念。
“知行合一”是具身智能的科學立場。根據具身智能的技術實現邏輯,“知”是建立在“行”之上的,也就是説只有通過“具身”才能理解某個場景。 [1] 

具身智能特徵特點

具身智能首先要具備可供性。可供性意味着要讓機器知道物體和場景能夠提供的是什麼,比如整個身體、部件怎麼和場景進行有效擬合。
具身智能還要具有功能性。具身智能在把物體作為工具使用的過程中,要能夠以任務執行為導向去理解功能。
具身智能需要實現因果鏈。就以上提到的“剷土”例子,智能體能否順利剷起土來是有因果關係的,例如控制揮動錘子的方式、動量、衝量等指標的改變程度和改變過程,需要用數學和物理的因果鏈來控制。 [1] 

具身智能發展困境

智能體學習如何使用工具涉及到多個認知和智能過程,這個過程即使對人類來説也並不容易。讓機器人掌握工具使用所涵蓋的所有技能是一項有挑戰性的難題。
這項工作包括三個層面:其一是底層的運動控制。很多研究基於阻抗控制(Impedance control)來跟蹤工具使用的運動軌跡,或在不同階段改變力和運動約束,或使用基於學習的方法來控制機器人運動軌跡。在底層控制中,魯棒地執行運動軌跡是關注的核心。
其二是中間層表徵。各種利於下游任務的中間表徵被提出,以便更好地理解工具的使用。儘管引入這些表徵有利於學習更多不同的工具使用技能,但它們目前仍然侷限於工具的形狀和任務之間的幾何關聯。
其三是理解在工具使用中的涉及的高層概念,比如物體的功能性(Functionality)和可供性(Affordance),以及工具使用中涉及的因果關係與常識,從而實現更好的泛化能力。 [1] 

具身智能發展趨勢

人工智能的技術前沿將朝着四個方向發展。第三個前沿方向為具身智能。具身智能指有身體並支持與物理世界進行交互的智能體,如機器人、無人車等,通過多模態大模型處理多種傳感數據輸入,由大模型生成運動指令對智能體進行驅動,替代傳統基於規則或者數學公式的運動驅動方式,實現虛擬和現實的深度融合。因此,具有具身智能的機器人,可以聚集人工智能的三大流派:以神經網絡為代表的連接主義,以知識工程為代表的符號主義和控制論相關的行為主義,三大流派可以同時作用在一個智能體,這預期會帶來新的技術突破 [6] 
參考資料