資策會 Physical AI AI Mobility System 機器人 人機共生

從智慧機器到自主系統加速落地應用 Physical AI成AI產業新戰場

2026-05-25
Physical AI正推動人工智慧從資訊理解邁向真實世界互動,隨著人形機器人、自駕載具與智慧照護等應用快速發展,Physical AI已成為全球科技與產業布局的重要方向,也將為台灣智慧製造、長照與服務創新帶來新契機。

Physical AI(實體AI)是人工智慧發展的重要新階段,此名詞首次出現於2021年論文“Physical Artificial Intelligence: The Concept Expansion of Next‐Generation Artificial Intelligence”,以Physical AI概念進行理論界定與分類。

Physical AI指的是將感知、推理、規劃與行動整合於能與真實世界互動的系統中,使AI不僅能理解資訊,更能對環境產生實際影響。它融合了機器人學、自主控制、深度學習與語言理解等領域的最新成果,是邁向具認知—行動一體化能力的自主智慧代理(Autonomous Intelligent Agent)的核心技術。其典型應用包括人形機器人、自駕車、無人機與自主移動載具等,被視為AI發展的終極方向。

在技術架構上,Physical AI可分為四大核心層面,如圖1所示:感知(Perception)、推理(Reasoning)、規劃(Planning)與行動(Action)。

圖1 Physical AI架構,包含感知、推理、規劃與行動四個核心層面

 

在感知階段,AI透過感測融合(Sensor Fusion)技術整合多源資料,如影像、聲音、雷達、深度感測與觸覺訊號,以建構對環境更穩健的理解;再藉由環境建模(World Model)技術,建立具即時性與持續更新能力的三維地圖與物體追蹤系統,為後續決策提供具體基礎。

推理層面則是AI智能的核心,涵蓋多種思維鏈模型(X of Thought),例如Chain-of-Thought、Tree-of-Thought、Graph-of-Thought等,以結構化方式展開多步推理。此外,Sim2Real(Simulation-to-Reality)技術讓AI能在虛擬模擬環境中學習策略與動作,再轉移至真實世界,降低訓練成本並提升安全性。

規劃階段可分為高層次任務規劃(High-level Action Planning)與低層次運動規劃(Low-level Motion Planning)。前者負責根據任務目標選擇策略、分解子任務與路徑選擇;後者則關注具體的機構動作、避障與動力控制等細節,使AI在複雜動態環境中維持穩定行為。

最後,行動層面結合動作控制(Motion Control)與端到端控制(End-to-End Control),後者透過VLA(Vision-Language-Action)模型,使AI能從語言指令與視覺輸入直接產生動作輸出,實現真正的多模態行動智慧。

技術重要性與影響

在政策層面,Physical AI已被主要國家視為戰略核心。美國的National Robotics Initiative聚焦人機協作與自主系統,日本的Moonshot#1明確設定於2050年實現具自主性的智慧機器,歐盟則以AI Act強化AI應用安全與倫理治理。Physical AI涵蓋AI、機器人、感測、控制與運算五大關鍵領域,是各國維持科技主權與創新優勢的戰略焦點。對台灣而言,Physical AI將是推動AI與機器人、智慧製造與智慧照護等產業升級的關鍵,亦是國家「AI新十大建設」的重要基礎。

在產業層面,Physical AI代表自動化2.0的轉折。傳統自動化僅能依固定程式執行任務,而Physical AI讓機器具備理解、互動與自主決策能力,從被動執行轉為主動學習與適應。這將帶動全新產品型態與服務模式,例如AI輪椅、智慧照護機器人、自動駕駛載具等,形成AI行動解決方案(AI Mobility System)的新市場,預期將推動製造、醫療、運輸、零售與長照產業的系統性轉型。

在社會層面,Physical AI的普及將推動人機共生社會(Human-AI Symbiosis)的形成。AI不再僅是資訊助理,而是能理解人類意圖、感知周遭環境並採取行動的夥伴。這類具身AI代理(Embodied AI Agent)能在長照、醫療、教育、服務等領域協助人力不足,減輕照護負擔,並以更自然的互動方式提升生活品質與社會福祉。

應用案例一:將AI帶入實體居家世界

近年來,機器人正從傳統程式化工具進化為具理解與學習能力的具身AI代理。應用場域也從封閉式工廠延伸到開放多變的居家與社會環境。例如2024年Tesla展示的Optimus機器人,已能完成摺衣、物品分揀等任務,預示機器人正朝向特定任務導向邁進。

Google DeepMind的RT-2則可結合視覺與語言理解,將語意指令轉化為實際操作。例如在面對撿起已滅絕的動物的指令時,系統能在獅子、鯨魚、恐龍等塑膠玩具中正確選出恐龍,展現了語意理解與物理辨識的整合能力。

Figure Helix則能處理生活中的各類小物品,如金屬鏈、帽子與玩具等,並可進一步執行冰箱與櫃子整理等任務,使機器人在家庭環境中展現更高實用性。由於家庭場景中充滿了種類繁多且形態不規則的物品,這類能力顯得格外關鍵。

這些國際案例顯示,AI已能從語言與影像理解延伸至具體行動,真正將AI帶入實體世界。

應用案例二:推動人機共生社會

在台灣,資策會所開發的具身AI代理(Embodied AI Agent)是Physical AI落地的重要實例。如圖2所示,該系統以人為核心設計,使載具能自主理解環境與任務,透過高精度室內定位與世界建模技術實現安全導航與精細操作,並支援多機協同調度。

圖2 資策會預計開發的人本行動載具示意圖

應用場域涵蓋長照機構的接駁與陪伴移動、博物館與商場導覽,以及醫院病患運送等,展現Physical AI在「從理解到行動」上的實務潛力,也象徵AI從虛擬走向實體、從輔助走向共生的轉折。

實體AI(Physical AI)象徵人工智慧從理解資訊走向真實世界行動的關鍵進展,透過整合感知、推理、規劃與行動能力,AI得以在真實環境中進行自主決策與執行。對台灣而言,Physical AI將成為串聯AI、機器人與智慧應用的重要基礎,開啟智慧製造、長照與服務創新的格局。

(本文作者為資策會總監)

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!