人工智慧 Agentic AI LLM Gemini CLI 代理型AI 資策會MIC

結合感知/推理/行動/學習 Agentic AI建構自主決策夥伴

2026-01-21
代理型AI正推動人工智慧由被動工具邁向具備自主決策與行動能力的智慧夥伴。透過感 知、推理、行動與學習的閉環機制,Agentic AI能主動規劃任務並解決複雜問題,已在開 發協作與智慧照護等場域展現顯著效益。

代理型AI是人工智慧技術的新一代形態,指能夠主動感知環境、設定目標、進行推理與採取行動的自主智慧系統。與僅能依照輸入指令回應的傳統AI不同,Agentic AI具備自主性與持續互動性,能在開放環境中根據情境自我決策,並不斷修正策略以達成任務。換言之,它不只是回答問題的助手,而是能「主動行動、規劃與協作」的智慧代理(AI Agent)。

傳統AI應用多屬被動型系統,主要依賴人類提供明確輸入與目標,例如影像辨識、語音轉錄或聊天機器人,執行範圍固定且缺乏持續行動能力。而Agentic AI則具備三大突破:

  1. 自主性(Autonomy):能自行設定子目標與任務計畫,而非被動等待指令。
  2. 持續性(Persistence):可長時間執行任務並持續追蹤結果,根據回饋調整行為。
  3. 互動性(Interactivity):能與其他代理、人類或外部系統協作,形成多代理協同網路。

因此,Agentic AI代表AI從工具邁向夥伴的演進階段。

代理型人工智慧的核心架構(圖1)通常包含以下四個層次與關鍵元件:

  • 感知層(Perception Layer):負責接收外部環境資訊,可能來自文字、語音、影像或資料庫。此層依賴大型語言模型(LLM)或多模態模型進行理解與語意解析。
  • 推理與決策層(Reasoning & Planning Layer):運用推理引擎、邏輯規劃與目標導向學習(Goal-oriented Learning)進行任務分解與決策。這是Agentic AI與傳統AI最大的技術區隔。
  • 記憶與學習模組(Memory & Learning Module):紀錄過往互動、任務結果與環境變化,並透過強化學習或長期記憶機制(如向量資料庫)優化未來決策。
  • 行動層(Action Layer):透過API、工具或其他系統介面執行具體行動。
  • 回饋與評估模組(Feedback & Evaluation Module):對行動執行產生的結果進行評估,並據此進行修正,提高達成任務的成功率。
圖1 代理型人工智慧的核心架構   圖片來源:ema.co

總體而言,代理型人工智慧結合了感知、推理、行動與學習四大能力,使AI能從靜態回應轉變為動態行動體。它是生成式AI邁向自主智能時代的關鍵里程碑,將廣泛應用於自動化工作流程、智慧助理、軟體開發與決策支援等領域,並重塑人機協作的新形態。

技術重要性與影響

代理型人工智慧(Agentic AI)是生成式AI的進化階段,結合大型語言模型(LLM)、自主決策機制與持續學習能力。與傳統AI被動回應不同,Agentic AI具備「感知-推理-行動」的閉環架構,能主動設定目標、規劃任務並與外部系統互動。這種自動化智慧代理將推動AI從輔助工具轉為自主協作夥伴,促進軟體自動化、生產力工具與人機協作模式的根本革新。

在產業層面,Agentic AI可廣泛應用於客服、金融、醫療、製造與教育等領域。這不僅降低人力成本,亦加速決策流程與創新效率。隨著多代理協作(Multi-agent Systems)與API整合成熟,產業將邁入AI營運(AI-driven Operations)的新時代,企業競爭力將取決於AI代理的智慧化程度與部署深度。

Agentic AI的普及也將深刻改變社會結構與勞動型態。它能提升整體生產力與知識工作自動化,但同時引發職位轉型、數據隱私與倫理治理等挑戰。AI代理具備自主行動能力,若缺乏適當監管,可能造成決策偏差或安全風險。因此,建立透明可控的AI行為框架與道德準則,將成為社會信任與科技永續發展的關鍵。

Agentic AI代表下一波全球科技競爭焦點。各國正加速投入AI代理平台、算力基礎設施與資料主權體系的建構。掌握此技術者不僅能提升產業自主性與創新能量,更能在建立自主AI代理生態系,培育跨領域人才並制定倫理標準,將是維持長期競爭力的關鍵策略。

代理型人工智慧標誌著AI從生成邁向行動的轉折點,其技術深度與社會滲透性將重塑產業格局與全球秩序。掌握Agentic AI,不僅是技術創新的挑戰,更是國家與社會未來競爭力的核心。

應用案例一 Google Gemini Cli

Gemini CLI是Google推出的一款開源對話式代理(Agent)工具,讓開發者可直接在終端(CLI)中使用其大型語言模型互動。其Agentic技術特色有:

・採用思考-行動(Reason-and-Act)循環:當使用者發出自然語言提示時,Gemini CLI將模型生成的思考(Reasoning)用於決定接下來的動作(Act),例如呼叫內建工具、檢索網路資訊、執行命令等。

・整合多項工具與環境:內建可用工具包括搜尋引擎、檔案操作、Shell命令等,使得代理不單純是聊天機器人,而是具有環境互動能力的智慧助理。

・開源與擴展性:該工具以Apache-2.0授權發布,使用者可自訂、擴展其功能以整合更多工具或內部流程。

・領域拓展:雖然主要聚焦編碼協作/終端開發流程,但實質上也可用於內容生成、深度研究、任務管理等多樣場景。

Google將agent技術從單一對話提升為工具呼叫+情境感知+行動決策的整合平台,使Gemini CLI成為開發者在終端環境中自然語言控制、快速執行多步任務的新型AI應用。

應用案例二 智慧長照訪視助理

資策會與地方政府衛生局合作開發智慧長照應用,運用手機或平板進行訪視錄音紀錄,上傳平台後,由AI助理產生逐字稿並做訪視摘要。AI助理可以據不同的檔案類型,自動決定使用相應的轉檔與分析工具與處理流程,最後生成訪視摘要。依據訪視單位各自不同工作重點與模板,找出個案的需要及需求,加速整理與完成時間。AI長照助理可提升行政與合規效率,大幅節省文書整理時間(1小時減少為15分鐘)。

代理型AI正推動AI由被動工具邁向具備自主決策與行動能力的智慧夥伴。透過感知、推理、行動與學習的閉環機制,Agentic AI能主動規劃任務並解決複雜問題,已在開發協作與智慧照護等場域展現顯著效益。未來,善用此技術將成為提升國家與企業競爭力的關鍵,同時需建立透明、可控的倫理與治理機制,確保人機協作能穩健發展並贏得社會信任。

(本文作者為資策會軟體院副主任)

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!