複製鏈接
請複製以下鏈接發送給好友

智能體

(人工智能領域中一個概念)

鎖定
智能體,顧名思義,就是具有智能的實體,英文名是Agent。以云為基礎,以AI為核心,構建一個立體感知、全域協同、精準判斷、持續進化、開放的智能系統
中文名
智能體
外文名
Agent
含    義
就是具有智能的實體
提    出
Minsky

智能體簡介

智能體是人工智能領域中一個很重要的概念。任何獨立的能夠思考並可以同環境交互的實體都可以抽象為智能體。
Agent是一個英文單詞,agent指能自主活動的軟件或者硬件實體。在人工智能領域,中國科學界把其譯為中文“智能體”。曾被譯為“代理”、“代理者”、“智能主體”等,中國科學界已經趨向於把之翻譯為:智能體,艾真體(蔡自興2002年提出)。

智能體概念的提出

IT界的智能體概念則是由麻省理工學院的著名計算機學家和人工智能學科創始人之一的Minsky提出來的,他在“Society of Mind”一書中將社會與社會行為概念引入計算系統。
傳統的計算系統是封閉的,要滿足一致性的要求,然而社會機制是開放的,不能滿足一致性條件,這種機制下的部分個體在矛盾的情況下,需要通過某種協商機制達成一個可接受的解。Minsky將計算社會中的這種個體稱為智能體。這些個體的有機組合則 構成計算社會——多智能體系統
Simon的有限性理論是多智能體系統形成的另一個重要的理論基礎,Simon認為一個大 的結構把許多個體組織起來可以彌補個體工作能力的有限;每個個體負責一項專門的任務可以彌補個體學習新任務的能力的有限;社會機構間有組織的信息流動可以彌補個體知識的有限;精確的社會機構和明確的個體任務可以彌補個體處理信息和應用信息的能力的有限。 [1] 

智能體定義

智能體是指駐留在某一環境下,能持續自主地發揮作用,具備駐留性、反應性社會性主動性等特徵的計算實體。
其實,智能體有很多種定義:
智能體在某種程度上屬於人工智能研究範疇,因此要想給智能體下一個確切的定義就如同給人工智能下一個確切的定義一樣困難。在分佈式人工智能分佈式計算領域爭論了很多年,也沒有一個統一的認識。
研究人員從不同的角度給出了智能體的定義,常見的主要有以下幾種:
(1) FIPA(Foundation forIntelligent Physical 智能體),一個致力於智能體技術標準化的組織給智能體下的定義是:“智能體是駐留於環境中的實體,它可以解釋從環境中獲得的反映環境中所發生事件的數據,並執行對環境產生影響的行動。” 在這個定義中,智能體被看作是一種在環境中“生存”的實體,它既可以是硬件(如機器人),也可以是軟件。
(2)著名智能體理論研究學者Wooldridge博士等在討論智能體時,則提出“弱定義”和“強定義”二種定義方法:弱定義智能體是指具有自主 性、社會性、反應性和能動性等基本特性的智能體;強定義智能體是指不僅具有弱定義中的基本特性,而且具有移動性通信能力、理性或其它特性的智能體;
(3) Franklin和Graesser則把智能體描述為“智能體是一個處於環境之中並且作為這個環境一部分的系統,它隨時可以感測環境並且執行相應的動作,同時逐漸建立自己的活動規劃以應付未來可能感測到的環境變化”;
(4) 著名人工智能學者、美國斯坦福大學的Hayes-Roth認為“智能智能體能夠持續執行三項功能:感知環境中的動態條件;執行動作影響環境條件;進行推理以解釋感知信息、求解問題、產生推斷和決定動作”;
(5) 智能體研究的先行者之一,美國的Macs則認為“自治或自主智能體是指那些宿主於複雜動態環境中,自治地感知環境信息,自主採取行動,並實現一系列預先設定的目標或任務的計算系統”。 [1-2]  [3] 

智能體特性

由以上定義可知,智能體具有下列基本特性:
(1)自治性(Autonomy ) : 智能體能根據外界環境的變化,而自動地對自己的行為和狀態進行調整,而不是僅僅被動地接受外界的刺激,具有自我管理自我調節的能力。
(2)反應性(Reactive):能對外界的刺激作出反應的能力、
(3)主動性(Proactive):對於外界環境的改變,智能體能主動採取活動的能力。
(4)社會性(Social ) : 智能體具有與其它智能體或人進行合作的能力,不同的智能體可根據各自的意圖與其它智能體進行交互,以達到解決問題的目的。
(5)進化性:智能體能積累或學習經驗和知識,並修改自己的行為以適應新環境。 [3-4] 

智能體區別內容

從智能體的特性就可以看出,智能體與對象既有相同之處,又有很大的不同。
智能體和對象一樣具有標識、狀態、行為和接口,但智能體和對象相比,主要有以下差異:
(1) 智能體具有智能,通常擁有自己的知識庫推理機,而對象一般不具有智能性;
(2)智能體能夠自主地決定是否對來自其它智能體的信息作出響應,而對象必須按照外界的要求去行動。也就是説智能體系統能封裝行為,而對象只能封裝狀態,不能封裝行為,對象的行為取決於外部方法的調用;
(3) 智能體之間有通信通常採用支持知識傳遞的通信語言。
但智能體可以看做是一類特殊的對象,即具有心智狀態和智能的對象,智能體本身可以通過 對象技術進行構造,而且大多數智能體都採用了面向對象的技術,智能體本身具有的特性又彌補了對象技術本身存在的不足,成為繼對象技術後,計算機領域的又一次飛躍。全球範圍內的智能體研究浪潮正在興起,包括計算機、人工智能以及其它行業的研究人員正在對該技術進行更深入的研究,並將其 引入到各自的研究領域,為更加有效地解決生產實際問題提供了新的工具。 [1-2]  [3-4] 

智能體應用架構

應用架構 應用架構
智能體應用架構由下面幾個部分組成:
  • 用户:用户是智能體的使用者;用户設定智能體的目標,定義性能指標;給智能體以指令。
  • 智能體:智能體根據用户給出的指令或設定的目標,感知觀測環境狀態,檢索內置知識和感知經驗記憶,對任務進行定義、分解和規劃,形成並執行行動策略,反饋作用於目標環境。
  • 工作環境:智能體工作交互的周邊事物和作用的對象;環境就是智能體關心的世界;智能體通過觀察感知來了解環境狀態。 [5] 

智能體工作環境

智能體環境定義

智能體離不開其工作環境。智能體的環境是其需要影響和適應的外在因素,它是智能體的控制對象。智能體通過與環境交互來觀察感知、規劃決策和行動執行等與環境形成反饋閉環以實現其目標。智能體通過觀測感知單元 (Sensor) 感知環境然後通過執行行動單元(Actuator)作用於環境來與環境交互來實現其預設的目標。在這個智能體系統中,環境是智能體知識的來源也是其作用的對象;智能體通過觀察感知環境的狀態,結合智能體內置的知識形成某種策略並作用於環境,從而優化其效用或收益,通過不斷迭代實現其目標。智能體的工作環境可以是物理環境也可以是虛擬環境。
比如對於自動駕駛智能體,它面對的工作環境元素包括道路、其它交通工具、警察、行人、乘客和天氣等。這些因素在交通管理和安全中起着重要的作用。

智能體環境特性

在實際應用中,智能體的工作環境往往不是一成不變的,也有一定的不確定性。
不確定性 (Nondeterminism):如果環境的下一個狀態完全由當前狀態和智能體執行的動作決定,那麼我們稱這個環境是確定性的(Deterministic);否則,它是非確定性的。大多數現實情況都如此複雜,以至於智能體不可能跟蹤所有未能觀察到的環境狀態;在這種情況下,它們被視為非確定性的。這是因為在真實的情境中,有太多未知的變量和因素,使得無法精確地預測下一個狀態。因此,在處理這些情況時,通常會將環境視為非確定性的,以考慮一些不確定性因素。如果環境的模型的不確定性明確涉及概率(例如,“明天下雨的概率為25%”),則該模型是隨機的 (Stochastic),而如果只列出可能性而沒有量化(例如,“明天有可能下雨”),則是非確定性的。
動態性 (Dynamics):智能體在進行規劃時環境的狀態往往會隨時間的推移而發生變化,那麼該智能體的環境是動態的 (Dynamic);否則,環境是靜態的。雖然靜態環境更易於處理,因為智能體在決定行動時無需不斷地觀察世界,也無需擔心時間的流逝,但大多實際應用中環境是動態的。自動駕駛智能體的環境顯然是動態的。智能體應對動態的或不確定的環境,可能需要不斷地獲得狀態的反饋,通過推斷了解環境狀態及其變化,可以及時地做出合適的行動決策並反饋作用於環境。 [5] 

智能體組成內容

智能體本身包括感知觀測單元 (Sensor)、記憶檢索單元(Memory)、推理規劃單元(Planner) 和行動執行單元(Actuator)。

智能體觀察和感知

智能體通過感知單元來觀測其環境,確定環境的相關狀態和變化,作為規劃學習決策的信息來源。智能體通過各種感知設備獲得不同的環境狀態信息,而其感知空間包括多種感官模式的多模態信息,如文本、聲音、視覺、觸覺、嗅覺等。智能體利用其感知歷史序列,即其曾經感知到環境狀態的完整歷史記錄,結合其內置的知識,通過縝密的規劃形成其行動決策。
理想的情況是環境的可觀測的(Observable),即智能體的感知器在每個時間點都能夠觀察到環境的完整狀態;實際上如果感知器檢測到與行動選擇相關的所有方面,那麼任務環境就可以被有效地認為是可觀察的。可觀察的環境非常便利,這樣智能體可以通過觀察環境的完整狀態來決定如何行動,而不需要額外的信息或內部狀態來幫助它做出決策。這使得任務的執行和決策更加簡單和直接。
如果一個環境是不可觀察或部分可觀察的,因為感知的環境狀態可能會存在噪聲和不準確性,或者環境狀態的某些部分根本沒有包含在感知器數據中,智能體可能需要藉助額外的其它信息或維護內部狀態來了解環境。

智能體記憶和檢索

智能體基於相關的信息,包括相關的內置知識和歷史記憶,產生行動策略。智能體需要藉助有效的存儲機制來記憶和檢索其內置知識和經驗記憶:
A. 內置知識:
智能體根據其應用場景,往往內置一定的知識;主要包括以下幾類知識:
  • 語言:如果智能體的交流介質是自然語言,則語言知識定義語法,它涵蓋了語言學、句法學、語義學和語用學等多方面語言規範。只有具備語言知識,智能體才能理解並進行對話交流。此外,當代語言模型可以讓智能體獲得多種語言的知識,這樣可消除額外的翻譯需求。
  • 常識:常識知識通常是指大多數人類具備的一般世界事實。例如,人們通常知道藥物用於治療疾病,傘用於防雨。這些信息可能在智能體交流的上下文中沒有明確被提及。如果不具備相應的常識知識,智能體可能會做出錯誤的決策,比如在大雨天不帶傘。
  • 領域:專業領域知識是指與特定應用領域和場景相關的知識,如數學、化學、醫學、編程、法律、金融、行業、人事、銷售等。智能體在特定領域內有效解決問題需要具備一定的專業領域知識。例如,旨在執行編程任務的智能體需要具備編程知識,如編程語言的代碼格式。同樣,用於診斷目的的智能體應該具備相應醫學知識,比如特定疾病的名稱和處方藥物。這些知識可能以參數的形式存儲在某個模型中,或經過處理後存儲在知識庫中,便於需要時檢索。另外,知識可以以多種形式存儲在記憶中,比如自然語言文本、嵌入 (Embeddings) 以及數據庫 (Databases) 等,每種形式都具有獨特的優勢。例如,自然語言可以保留全面的語義信息,便於應用於推理;而嵌入可以提高記憶讀取的效率。
B. 歷史記憶:
在智能體系統中,歷史記憶記錄存儲了智能體過去的觀測、思考和行動的經驗序列。特別是智能體通過行動來激發環境或其它方式來探索觀測感知環境獲得環境狀態的相關信息,此外還要從它的內置知識和歷史記憶中思考學習。智能體依賴記憶機制來獲取先前的經驗以有效地制定行動策略和決策。當面臨類似問題時,記憶機制有助於智能體有效地應用之前的策略。此外,這些記憶機制使智能體能夠借鑑過去的經驗來適應陌生的環境。記憶機制還需要解決下面的問題:
  • 記錄的長度:基於語言模型的智能體以自然語言格式與語言模型互動,將歷史記錄附加到每個輸入中。隨着這些記錄的增加,它們可能會超出模型架構的限制。
  • 記憶的檢索:隨着智能體積累大量的觀測和行動歷史序列數據,面臨着數據量不斷增加的記憶負擔。這使得為試圖建立主題之間的關聯來檢索相關的記憶內容變得越來越具有挑戰性,可能導致智能體的迴應與當前上下文不一致。

智能體推理和規劃

基於目標的推理和規劃能力是智能體智能的基本體現,它們有助於智能體分析解決複雜問題。推理以證據和邏輯為基礎,它是分析解決問題以及做出合理決策的基石。人類主要推理形式包括演繹 (Deduction)、歸納(Induction) 和擔綱 (Abduction) 推理。推理對於智能體處理複雜任務至關重要。而規劃有助於智能體在面對複雜挑戰時形成應對策略;它給智能體賦予一種結構化的思考過程,即組織思維、設定目標,並確定實現這些目標的步驟。對於智能體來説,規劃能力的核心是推理能力;通過推理,智能體將複雜的任務拆分為更易管理的子任務,併為每個子任務的完成制定適當的計劃。
另外,推理和規劃賦予智能體學習的能力,有助於智能體學習積累知識和經驗。智能體的初始配置和計劃可能反映了對環境的一些先前知識,但隨着任務的進行,智能體通過推理和規劃獲得更多的知識和經驗,使得先前擁有的知識和經驗可能會被修改和增強;通過推理和規劃,智能體還可以利用內省來優化和修改其行動策略和計劃,確保其與環境現實情況更好地保持一致,從而適應環境、更有效地執行任務併成功達成目標。

智能體行動和執行

行動執行單元負責將智能體的決策轉化為具體的行動,並直接執行將行動作用於環境,並影響環境的未來狀態達到其目標。通常情況下,智能體在任何特定時刻的行動選擇可以依賴於其內置知識和到目前為止觀察到的整個感知序列,但不能依賴於它尚未感知到的任何事物。這意味着智能體的行動是基於已有的信息和經驗來做出的,而不是基於未知的因素。智能體可通過其本身的輸出,比如語言模型的文本輸出,來完成行動執行,但往往需要借外力擴展行動空間,比如智能體具身行動能力和使用外部工具的能力,以便更好地應對環境變化、提供反饋和改變塑造環境。智能體通過為每個可能的感知序列做出決策並指定其行動選擇。從數學角度來看,智能體的行為由行動函數描述,該函數將任何給定的感知序列映射到一個行動。 [5] 
參考資料