如何利用 Agent 構建AI服務

近年來,人工智能(AI)技術的飛速發展引起了廣泛的關注和討論。而如今,我們正站在一個全新的時代門檻前,面對着AI Agent帶來的的嶄新未來。以LLM(大型語言模型)作爲其核心控制器構建代理是一個很酷的概念。它模擬人類的工作流程,能夠自主進行信息搜索、分析、利用,以完成目標。

OpenAI 聯合創始人Andrej Karpathy 在Twitter上用比喻描述了AI Agent的過程:每一次GPT的調用就像一次思考。通過將他們串聯起來,就可以創建出可以感知、思考和行動的Agent 系統。

目前已經存在不少AI Agent系統的案例,例如AutoGPT、BabyAGI、Camel、Jarvis、AgentGPT等。

AI Agent 系統是如何工作的?

AI Agent 系統如此強大,那麼他到底是如何工作的呢?

在AI Agent系統中,LLM引擎充當其大腦,爲其提供了強大的處理能力和智能思維。除此之外,還輔以幾個關鍵組件:

  • 任務規劃:爲 AI Agent 系統提供任務分解 (task decomposition) 和自我反思 (self reflection) 的能力。

  • 記憶:爲 AI Agent 系統提供長時間保存和回憶額外信息的能力。

  • 工具使用:讓 AI Agent 可以對外部做出動作,真實地影響現實世界。

任務規劃

AI 機器人(AI-BOT)在任務分解階段,通常是使用思維鏈(CoT, Chain of Thoughts) 和思維樹(ToT, Tree of Thoughts) 等技術。

CoT通過 “think step by step” (分步思考),將複雜任務逐步分解爲更小、更簡單的步驟。它將大任務拆分爲多個可以實現的小任務,並闡明瞭LLM思考推理的過程。

ToT則嘗試同時考慮多個潛在的可行計劃。它在每一步嘗試探索更多可能性,首先將問題分解爲多個思考步驟,並在每個步驟中生成多個思考,從而創建一個思維樹。

而在自我反思階段,AI Agent 回顧過去的行動和決策,並糾正以前的錯誤來迭代改進自身。自我反思目前常用的技術有ReAct、Reflextion、Chain of Hindsight 等。

ReAct通過追蹤LLM的推理過程來讓模型優化、跟蹤和更新行動計劃,並能處理異常情況。

Reflextion則比ReAct更進一步,在ReAct的流程中加入推理評估來嘗試改進推理結果。

Chain of Hindsight則是通過大量的反饋結果中學習並優化推理結果。

記憶

image
人腦的記憶分爲三種:感官記憶、短期記憶和長期記憶。

感官記憶是人的視覺、聽覺、觸覺等反饋而來的記憶,通常只有數秒;短期記憶是人當前正在執行的認知任務的相關記憶,通常會持續數十秒;長期記憶則是人過往的經歷和回憶,通常會長達數十年,我們的大腦會在需要時自動從長期記憶中提取出對應的記憶來使用。

AI Agent也模擬了人腦記憶的使用過程,對於較短的感官記憶和短期記憶,AI Agent 可以直接將其放入上下文中;而對於長期記憶,AI Agent 將其存儲在外部,需要時再根據需要提取出相關的記憶來使用。

我們現在通常使用向量數據庫來存儲、搜索外部記憶,它使用最大內積搜索(MIPS)的技術來對記憶進行相關性搜索,目前常用的MIPS 的算法有LSH、ANNOY、HNSW、FAISS、ScaNN等。

工具使用

工具的使用也是很重要的環節,任務規劃、反思和記憶只是讓AI Agent有了思考的能力,但是他還需要能使用工具才能做出具體的行動。給AI Agent裝配上工具,相當於給予了他手足,讓他能夠通過利用各種工具和資源來完成任務。

目前的ChatGPT Plugins 和OpenAI API function calling 都是LLM使用工具的非常好的實踐案例。除此之外,還有MRKL、TALM、Toolformer、HuggingGPT和API Bank等使用工具的方法。

AI Agent 的經典案例: Auto GPT

image

AutoGPT 是一個實驗性的開源AI Agent程序,它利用GPT-4來自主管理任務,例如創建網站、撰寫文章、生成Logo或推廣產品等。它可以訪問互聯網,並收集、分析各種信息,從網絡中學習並完成任務。

AutoGPT的驚人之處在於它的自治性。他是完全獨立運作的,不需要使用者的額外干預。他還擁有長期和短期記憶系統,這讓他能記住過往做過的事情,從經驗中學習,並根據過去的行動自行優化決策,這讓它可以隨着時間不斷自我改進。

AI Agent 尚未解決的問題

AI Agent 的發展和應用在許多領域中都呈現出了巨大的潛力和前景。然而,就像任何其他技術一樣,AI Agent 也有一些限制:

有限的上下文長度:受限的上下文容量限制了AI Agent系統的效果,尤其是任務規劃和自我反思這樣的機制。雖然向量存儲和檢索可以提供對外部信息的訪問,但它們的表示能力不如完全關注那麼強大。

長期規劃和任務分解的挑戰:雖然AI Agent在解決特定任務方面可能非常出色,但與人類相比,在長期規劃和任務分解方面仍存在顯著的差距。

自然語言接口的可靠性:當前的AI Agent系統依賴自然語言作爲LLM與外部組件的接口。然而,大語言模型的輸出並不是完全可靠的,因爲他偶爾可能會出現格式錯誤,或表現出叛逆行爲。

當然,隨着AI技術的飛速演進,我們相信,這些限制都會在不久的將來得到解決。

如何實現AI Agent?

儘管當前技術發展階段下AI Agent尚未足夠成熟,不足以將任務完全託管,但我們依然能夠通過一些有效的方式,在GPTBots(https://gptbots.ai/developer/)平臺上,以更加務實和合理的中間方案,實現Agent能力。

Flow BOT —— 可視化地規劃任務流程

任務規劃是AI Agent的關鍵組件之一。GPTBots(https://gptbots.ai/developer/)平臺則提供以可視化組件搭建任務流程創建AI-BOT的能力——Flow BOT。平臺已將常見的、通用的AI-BOT開發模塊抽象爲了多個組件。開發者可以在界面上,通過簡單的托拉拽方式,根據自身業務需求,將不同組件進行”規劃“,拼接爲一個“任務”,並定義爲一個AI-BOT,以解決特定的問題。
image

Flow BOT不僅擁有靈活的任務流配置能力,在不同的開發模塊內也提供了衆多的可配置項,例如輸入、輸出、插件、知識庫、條件判斷等,可以幫助開發者靈活地應對各種業務場景。

插件 —— 讓AI-BOT執行任意任務

AI Agent需要有工具才能執行各類任務,而GPTBots(https://gptbots.ai/developer/)平臺提供的插件(Plugin)就是這麼一款工具。

GPTBots平臺官方提供了涵蓋學術、商業、生活和工作等諸多領域的公共插件,供開發者加入AI-BOT內進行調用,讓AI-BOT擁有了與外界溝通的能力,並執行對應任務。

同時,GPTBots平臺也爲開發者提供了“插件開發”能力,讓開發者能夠根據自身的要求開發插件,並接入AI-BOT調用,以滿足自己的業務場景需求。

長短記憶 —— 用更充沛的信息來做決策

記憶設置是GPTBots(https://gptbots.ai/developer/) 平臺提供的另一項有利於實現Agent能力的功能。開發者可以通過對AI-BOT進行長記憶和短記憶的設置,來對AI-BOT的問題處理能力進行拓展。

在解決規模較大,信息量較多的問題時,長記憶的能力顯得尤爲關鍵。而在處理一般問題時,短記憶便已足夠。在解決單輪問答問題時,甚至可以用不着長短記憶能力。

這也使得該功能擁有了另外一層價值:開發者能夠應根據自身的需求,理性地定義AI-BOT的記憶設置,因爲因爲更長的記憶,就意味着更多的成本消耗。長短記憶功能,爲開發者控制AI-BOT成本,提供了一種方向。

AI Agent 的未來

AI Agent強大的能力,將讓他成爲我們未來無處不在的助手,爲我們的生活和工作提供協助和支持。無論是在家庭生活中,幫助我們管理日常事務和家務,還是在工作場所中,協助我們處理數據和決策,AI Agent 都將發揮重要作用。

在家庭生活中,AI Agent可以成爲一個智能家居管家,通過學習我們的喜好和習慣,自動調節室溫、照明和音樂,提供個性化的生活體驗。它們還可以幫助我們管理購物清單、日程安排和提醒事項,讓我們的生活更加便捷高效。

在工作場所中,AI Agent成爲我們的智能助手和數據分析師。它們可以快速處理大量的數據,提供準確的分析和預測,幫助我們做出更明智的決策。AI Agent 還可以自動化繁瑣的任務,提高工作效率,並減輕人們的工作壓力。

當然,作爲一種新興技術,AI Agent 也面臨着一些挑戰和風險。我們需要確保AI Agent助手的安全性和可靠性,避免出現意外事故和不良後果。同時,我們也需要制定相關的法規和行業規範,明確責任和監管機制,以保障AI Agent的合理使用和發展。

目前的AI Agent還在初始階段,或許尚不完善,但如果這個方向保持和生成式AI相同的發展速度,那麼我們可能很快就能看到商業化的AI Agent助手出現在我們身邊。這一天也許很快就會到來。

極光GPTBots已上線,訪問https://www.gptbots.ai立即註冊體驗!

註冊即贈送積分贈送。參與企業認證或邀請好友註冊,也能獲取更多積分~

關於極光
極光(Aurora Mobile,納斯達克股票代碼:JG)成立於2011年,是中國領先的客戶互動和營銷科技服務商。成立之初,極光專注於爲企業提供穩定高效的消息推送服務,憑藉先發優勢,已經成長爲市場份額遙遙領先的移動消息推送服務商。隨着企業對客戶觸達和營銷增長需求的不斷加強,極光前瞻性地推出了消息雲和營銷雲等解決方案,幫助企業實現多渠道的客戶觸達和互動需求,以及人工智能和大數據驅動的營銷科技應用,助力企業數字化轉型。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章