近年來，人工智能（AI）技術的飛速發展引起了廣泛的關注和討論。而如今，我們正站在一個全新的時代門檻前，面對着AI Agent帶來的的嶄新未來。以LLM（大型語言模型）作爲其核心控制器構建代理是一個很酷的概念。它模擬人類的工作流程，能夠自主進行信息搜索、分析、利用，以完成目標。

OpenAI 聯合創始人Andrej Karpathy 在Twitter上用比喻描述了AI Agent的過程：每一次GPT的調用就像一次思考。通過將他們串聯起來，就可以創建出可以感知、思考和行動的Agent 系統。

目前已經存在不少AI Agent系統的案例，例如AutoGPT、BabyAGI、Camel、Jarvis、AgentGPT等。

AI Agent 系統是如何工作的？

AI Agent 系統如此強大，那麼他到底是如何工作的呢？

在AI Agent系統中，LLM引擎充當其大腦，爲其提供了強大的處理能力和智能思維。除此之外，還輔以幾個關鍵組件：

任務規劃：爲 AI Agent 系統提供任務分解 (task decomposition) 和自我反思 (self reflection) 的能力。
記憶：爲 AI Agent 系統提供長時間保存和回憶額外信息的能力。
工具使用：讓 AI Agent 可以對外部做出動作，真實地影響現實世界。

任務規劃

AI 機器人（AI-BOT）在任務分解階段，通常是使用思維鏈(CoT, Chain of Thoughts) 和思維樹(ToT, Tree of Thoughts) 等技術。

CoT通過 “think step by step” (分步思考)，將複雜任務逐步分解爲更小、更簡單的步驟。它將大任務拆分爲多個可以實現的小任務，並闡明瞭LLM思考推理的過程。

ToT則嘗試同時考慮多個潛在的可行計劃。它在每一步嘗試探索更多可能性，首先將問題分解爲多個思考步驟，並在每個步驟中生成多個思考，從而創建一個思維樹。

而在自我反思階段，AI Agent 回顧過去的行動和決策，並糾正以前的錯誤來迭代改進自身。自我反思目前常用的技術有ReAct、Reflextion、Chain of Hindsight 等。

ReAct通過追蹤LLM的推理過程來讓模型優化、跟蹤和更新行動計劃，並能處理異常情況。

Reflextion則比ReAct更進一步，在ReAct的流程中加入推理評估來嘗試改進推理結果。

Chain of Hindsight則是通過大量的反饋結果中學習並優化推理結果。

記憶

人腦的記憶分爲三種：感官記憶、短期記憶和長期記憶。

感官記憶是人的視覺、聽覺、觸覺等反饋而來的記憶，通常只有數秒；短期記憶是人當前正在執行的認知任務的相關記憶，通常會持續數十秒；長期記憶則是人過往的經歷和回憶，通常會長達數十年，我們的大腦會在需要時自動從長期記憶中提取出對應的記憶來使用。

AI Agent也模擬了人腦記憶的使用過程，對於較短的感官記憶和短期記憶，AI Agent 可以直接將其放入上下文中；而對於長期記憶，AI Agent 將其存儲在外部，需要時再根據需要提取出相關的記憶來使用。

我們現在通常使用向量數據庫來存儲、搜索外部記憶，它使用最大內積搜索(MIPS)的技術來對記憶進行相關性搜索，目前常用的MIPS 的算法有LSH、ANNOY、HNSW、FAISS、ScaNN等。

工具使用

工具的使用也是很重要的環節，任務規劃、反思和記憶只是讓AI Agent有了思考的能力，但是他還需要能使用工具才能做出具體的行動。給AI Agent裝配上工具，相當於給予了他手足，讓他能夠通過利用各種工具和資源來完成任務。

目前的ChatGPT Plugins 和OpenAI API function calling 都是LLM使用工具的非常好的實踐案例。除此之外，還有MRKL、TALM、Toolformer、HuggingGPT和API Bank等使用工具的方法。

AI Agent 的經典案例: Auto GPT

AutoGPT 是一個實驗性的開源AI Agent程序，它利用GPT-4來自主管理任務，例如創建網站、撰寫文章、生成Logo或推廣產品等。它可以訪問互聯網，並收集、分析各種信息，從網絡中學習並完成任務。

AutoGPT的驚人之處在於它的自治性。他是完全獨立運作的，不需要使用者的額外干預。他還擁有長期和短期記憶系統，這讓他能記住過往做過的事情，從經驗中學習，並根據過去的行動自行優化決策，這讓它可以隨着時間不斷自我改進。

AI Agent 尚未解決的問題

AI Agent 的發展和應用在許多領域中都呈現出了巨大的潛力和前景。然而，就像任何其他技術一樣，AI Agent 也有一些限制：

有限的上下文長度：受限的上下文容量限制了AI Agent系統的效果，尤其是任務規劃和自我反思這樣的機制。雖然向量存儲和檢索可以提供對外部信息的訪問，但它們的表示能力不如完全關注那麼強大。

長期規劃和任務分解的挑戰：雖然AI Agent在解決特定任務方面可能非常出色，但與人類相比，在長期規劃和任務分解方面仍存在顯著的差距。

自然語言接口的可靠性：當前的AI Agent系統依賴自然語言作爲LLM與外部組件的接口。然而，大語言模型的輸出並不是完全可靠的，因爲他偶爾可能會出現格式錯誤，或表現出叛逆行爲。

當然，隨着AI技術的飛速演進，我們相信，這些限制都會在不久的將來得到解決。

如何實現AI Agent？

儘管當前技術發展階段下AI Agent尚未足夠成熟，不足以將任務完全託管，但我們依然能夠通過一些有效的方式，在GPTBots（https://gptbots.ai/developer/）平臺上，以更加務實和合理的中間方案，實現Agent能力。

Flow BOT —— 可視化地規劃任務流程

任務規劃是AI Agent的關鍵組件之一。GPTBots（https://gptbots.ai/developer/）平臺則提供以可視化組件搭建任務流程創建AI-BOT的能力——Flow BOT。平臺已將常見的、通用的AI-BOT開發模塊抽象爲了多個組件。開發者可以在界面上，通過簡單的托拉拽方式，根據自身業務需求，將不同組件進行”規劃“，拼接爲一個“任務”，並定義爲一個AI-BOT，以解決特定的問題。

Flow BOT不僅擁有靈活的任務流配置能力，在不同的開發模塊內也提供了衆多的可配置項，例如輸入、輸出、插件、知識庫、條件判斷等，可以幫助開發者靈活地應對各種業務場景。

插件 —— 讓AI-BOT執行任意任務

AI Agent需要有工具才能執行各類任務，而GPTBots（https://gptbots.ai/developer/）平臺提供的插件（Plugin）就是這麼一款工具。

GPTBots平臺官方提供了涵蓋學術、商業、生活和工作等諸多領域的公共插件，供開發者加入AI-BOT內進行調用，讓AI-BOT擁有了與外界溝通的能力，並執行對應任務。

同時，GPTBots平臺也爲開發者提供了“插件開發”能力，讓開發者能夠根據自身的要求開發插件，並接入AI-BOT調用，以滿足自己的業務場景需求。

長短記憶 —— 用更充沛的信息來做決策

記憶設置是GPTBots（https://gptbots.ai/developer/）平臺提供的另一項有利於實現Agent能力的功能。開發者可以通過對AI-BOT進行長記憶和短記憶的設置，來對AI-BOT的問題處理能力進行拓展。

在解決規模較大，信息量較多的問題時，長記憶的能力顯得尤爲關鍵。而在處理一般問題時，短記憶便已足夠。在解決單輪問答問題時，甚至可以用不着長短記憶能力。

這也使得該功能擁有了另外一層價值：開發者能夠應根據自身的需求，理性地定義AI-BOT的記憶設置，因爲因爲更長的記憶，就意味着更多的成本消耗。長短記憶功能，爲開發者控制AI-BOT成本，提供了一種方向。

AI Agent 的未來

AI Agent強大的能力，將讓他成爲我們未來無處不在的助手，爲我們的生活和工作提供協助和支持。無論是在家庭生活中，幫助我們管理日常事務和家務，還是在工作場所中，協助我們處理數據和決策，AI Agent 都將發揮重要作用。

在家庭生活中，AI Agent可以成爲一個智能家居管家，通過學習我們的喜好和習慣，自動調節室溫、照明和音樂，提供個性化的生活體驗。它們還可以幫助我們管理購物清單、日程安排和提醒事項，讓我們的生活更加便捷高效。

在工作場所中，AI Agent成爲我們的智能助手和數據分析師。它們可以快速處理大量的數據，提供準確的分析和預測，幫助我們做出更明智的決策。AI Agent 還可以自動化繁瑣的任務，提高工作效率，並減輕人們的工作壓力。

當然，作爲一種新興技術，AI Agent 也面臨着一些挑戰和風險。我們需要確保AI Agent助手的安全性和可靠性，避免出現意外事故和不良後果。同時，我們也需要制定相關的法規和行業規範，明確責任和監管機制，以保障AI Agent的合理使用和發展。

目前的AI Agent還在初始階段，或許尚不完善，但如果這個方向保持和生成式AI相同的發展速度，那麼我們可能很快就能看到商業化的AI Agent助手出現在我們身邊。這一天也許很快就會到來。

極光GPTBots已上線，訪問https://www.gptbots.ai立即註冊體驗！

註冊即贈送積分贈送。參與企業認證或邀請好友註冊，也能獲取更多積分~

關於極光
極光（Aurora Mobile，納斯達克股票代碼：JG）成立於2011年，是中國領先的客戶互動和營銷科技服務商。成立之初，極光專注於爲企業提供穩定高效的消息推送服務，憑藉先發優勢，已經成長爲市場份額遙遙領先的移動消息推送服務商。隨着企業對客戶觸達和營銷增長需求的不斷加強，極光前瞻性地推出了消息雲和營銷雲等解決方案，幫助企業實現多渠道的客戶觸達和互動需求，以及人工智能和大數據驅動的營銷科技應用，助力企業數字化轉型。

如何利用 Agent 構建AI服務

AI Agent 系統是如何工作的？

任務規劃

記憶

工具使用

AI Agent 的經典案例: Auto GPT

AI Agent 尚未解決的問題

如何實現AI Agent？

Flow BOT —— 可視化地規劃任務流程

插件 —— 讓AI-BOT執行任意任務

長短記憶 —— 用更充沛的信息來做決策

AI Agent 的未來

AIGC | LLM 提示工程 -- 如何向ChatGPT提問

極光筆記 | 聊一聊推送系統中事件驅動架構的應用

極光筆記 | 大語言模型插件

極光筆記 | 極光服務的信創改造實踐

極光筆記 | 推送服務數據中心選擇：合規性與傳輸效率的雙重考量

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結