AI 人形機器人 Autonomous Robot 自主機器人符號型AI 機器學習 SLAM OEM

結合機器學習/符號型AI　人形機器人自主能力大躍進

2025-10-31

誠君

人工智慧的三大要素為晶片算力、演算法模型與資料庫數據。若將符號型AI與機器學習結合，能使人形機器人具備更高自主能力。符號型AI以規則形式推理知識，機器學習則擅長從資料中建立模式，兩者結合可兼具推理與學習。具知識庫的自主機器人能整合感測資料、物件資訊與任務規劃，進行符號化與新知生成。透過環境建模與任務規劃模組，機器人能理解現實世界、建立行動策略，像是自主推論從廚房移動到臥室的路徑。此種知識驅動架構使機器人能在開放環境中自我決策與行動，展現類人智慧的進化方向。

晶片算力、演算法模型、資料庫數據可說是人工智慧(AI)的三大要素。符號型(Symbolic)AI需運用到資料庫技術，它與機器學習結合後，可使人形機器人(Humanoid Robot)更具自主能力。

人形機器人
機器人(Robot)包含了多種科技，它通常被應用於製造業、太空探索和國防工業。而人形機器人是泛指外型與人體相似的機器人。若人形機器人的動作或行為和人類的一舉一動極為酷似，並具有一定程度的自我判斷能力，就可稱作自主的人形機器人，底下簡稱自主機器人(Autonomous Robot)。

傳統的機器人仍依賴機器學習或深度學習技術，例如：物件辨識(Object Recognition)。雖然，這帶來了巨大的進步，但機器人技術的下一步是要使傳統的機器人能夠在真實世界中自主行動，而且盡量不依靠人類的協助。自主機器人能在開放的環境中，自行定義規則，以應付不確定或不斷變化的真實環境。換言之，它與非自主機器人的最大不同處是：非自主機器人是在具有明確規則的封閉世界中運行，例如：設置在工廠中的機器人。

符號型AI
符號型AI是AI研究領域的一個分支，是以電腦程式為符號形式，藉此明確地表示人類的知識。20世紀的90年代初，符號型AI曾是AI研究的主流。不過，由於必須以明確且有規則的形式將人類的知識表示出來，但以電腦程式建構的符號系統，無法理解隱性知識，又無法隨著時間不斷自我改進，因此符號型AI一度失去了主流地位。到2010年代初期，機器學習以及後來的深度學習取代了符號型AI，成為AI研究的主流。

符號型AI主要專注於建立具有規則引擎(Rule Engine)的專家系統，可以將其視為能得出結論的大型if-then語句系統。其規則是：當輸入值和條件相匹配時，就可得出結論。規則是精確且通用的，不是根據經驗學習到的。但只有當規則始終有效時，才能將此規則新增至系統。這是它的優點，也是它的缺點。因為對於意外情況，可能缺乏靈活性。

與符號型AI相較，機器學習或深度學習是透過檢視資料集的相關性，來創建弱規則(Weak Rule)的系統。機器學習演算法的缺點是：通常它只能在訓練資料中有存在的情況下才能運行。這意味著，由於它可能會遇到大量未見過的場景，因此要自主做決策是很困難的。而機器學習的這個缺點是源自於其通用化能力有限。通用化是指模型將訓練資料中學到的知識，應用到處理新資料的能力。

相反的，符號型AI的優點是：只要規則成立，它就能夠完美地概括其它新資料。所以，符號型AI相當於機器學習中的零樣本(Zero-Shot)學習。正因為機器學習的這種局限性，機器人技術最突破性的發展之一就是將機器學習與符號型AI相結合。這表示必須在具有高度層次結構(Hierarchical Structure)的知識庫(Knowledge Base)或知識圖(Knowledge Graph)上運行機器學習演算法，而不是使用單純的數據。如此能產生兩全其美的效果。此外，還能獲得下列的好處：

學習由推理得出的新知識，藉此能改進機器學習演算法，並減少所需的資料量。
將任何資料的上下連接關係，或隱性知識，嵌入至學習模型中，藉此提高機器學習模型的準確度。
機器學習模型不再缺乏可解釋的答案，譬如：能回答這樣的問題為何模型做出這樣的預測？

知識庫
自主機器人的知識庫必須準確地表示真實世界，並在獨立執行任務時，對它所處的環境進行推理，這稱為知識驅動的機器人程式設計典範(Knowledge-Enabled Robot Programming Paradigm)。它將應用程式與知識分開：一邊是在機器學習模型上運行的應用程式。另一邊是機器人為了瞭解其所處的環境，或與環境互動時所需的資訊或知識，並將這些知識模組化，儲存於機器人的知識庫中。

具有知識庫的自主機器人需要整合各種類型的資料，譬如：感測器的數據、真實世界的物件、規劃時間表、機器學習演算法等。所以，機器人系統需要一個優良的資料庫，能整合這些複雜的異質資料，在真實環境中，執行任務時，能自主做決策，並準確地對不斷變化的環境進行建模。簡言之，以知識驅動的機器人必須具備這三個按先後順序執行的功能：創建符號、對符號進行推理、得出新知識。

建構機器人系統的方法有很多，從所謂的感知－行為架構，到更複雜的感知－決定－行為架構。機器人的自主程度主要取決於其自身推理和決策能力，這些大都是模仿人類的認知能力。自主機器人是透過執行一系列的任務來發揮作用。例如：機器人想從A點，移動到B點時，它必須能夠自主創建移動計劃，通常這是透過任務規劃模組完成的。但在執行移動計劃之前，它需要由環境模型模組提供環境描述。下文使用知識庫，針對室內自主機器人的移動，說明如何建立這兩個模組。

環境建模
建構環境模型包含了各種技術，但其目的都是為了能夠精確地表示真實世界。其中一項技術是物件辨識。當自主機器人在真實世界中行動時，它會透過多模態感測器(Multi-Modal Sensor)獲取感官特徵(Sensory Feature)，並使用預先訓練的機器學習模型對物件進行分類。除了物件以外，自主機器人還必須能夠確定它目前所在的位置。與物件辨識一樣，它可以將環境特徵傳送給機器學習或深度學習模組，來確定其位置。

擁有知識庫的自主機器人可以識別這些物件和位置，並將這些資訊映射到知識庫中，這個過程稱為符號基礎(Symbolic Grounding)。簡言之，這過程是關於符號如何與物理世界連結在一起，並使符號獲得意義。這對於使用符號來代表真實世界的感官特徵，以及建立起可供自主機器人自行推理的知識庫至關重要。

傳統上，使用同時定位與繪圖(Simultaneous Localization And Mapping, SLAM)等技術也可以建立環境模型，並透過幾何地圖確定機器人的位置。然而，透過創建知識庫，自主機器人就可以自己做決策，不再需要SLAM等花費大量資源的方法。當自主機器人透過機器學習模組，將其觀察結果映射到知識庫時，真實世界的本體就被創建了。例如：人類是從三個角度去觀看一座建築物：幾何、物理和功能。幾何視角是將房間表示為多邊形的點和線。物理視角是代表房間中實際存在的東西，譬如：門或窗。功能視角是描述各種類型的房間，譬如：客廳或廚房。

在幾何視圖中，如圖1，使用四邊形代表房間，直線代表房間的牆壁，點代表角落。圖1左側四邊形就是代表一個有門的房間，圖1最右側是此四邊形的數學連結關係的映射圖，直線代表邊(Edge)，點代表頂點(Vertex)。然後，可將這些邊、頂點和連結關係轉換成資料庫中的綱要(Schema)。

利用物件辨識模組，可以將幾何視圖映射到物理視圖和功能視圖。如圖2中的四邊形的line4可以透過taking-form連結關係映射到物理視圖中的門，而門可以透過Constructing連結關係映射到功能視圖中的客廳或廚房。門是一種概念，被歸類為Connector的一個類別。Connector還包含其它類別，例如：樓梯。所以，Connector類別的主要特徵就是能連接不同房間。最後，再將這些不同類別加入資料庫的綱要內，並建立一個新規則，譬如：相鄰房間的連接(Adjacent-Room-Connection)。當資料庫的綱要建立完成後，自主機器人就可以使用內建的推理引擎(Reasoning Engine)，自行得出新知識。例如：利用相鄰房間的連接這條規則和特定的連結關係，自主機器人就能推測出兩個房間之間是透過何種類型的Connector連接，譬如：門或樓梯。

任務規劃
自主機器人也是使用知識庫進行自動化的任務規劃。為達此目的，可建立一個任務規劃模型，以環境模型為基礎，並將規模擴大。使用概念化或可理解的結構化資料(Structured Data)和邏輯來描述自主機器人在真實環境中的任務規劃網路。此任務規劃模型採用了數種規劃概念和方法，特別是規劃域定義語言(PDDL)、分層任務網路(HTN)和馬可夫決策過程(MDP)。

首先給定一個特定的任務，並分別以Actual-State和Goal來表示自主機器人在此任務的初始狀態和最終狀態。如圖3，自主機器人為了到達目標位置，會先執行初始任務，這會啟動一些作業，使系統從一個狀態轉移到下一個狀態。實際的執行者是Operator，它是系統組件之一，能使自主機器人執行其初始任務。而Divisioning是代表兩種角色的關係，它對複合任務(Compound-Task)或初始任務的層次結構進行環境建模。初始任務只有在滿足某些條件時才能被執行，這些條件的內容是用Task-Requirement和Contextual-Condition表示。如圖4，假設自主機器人的任務是要從廚房移動到臥室，它必須利用推理引擎自主創建移動計劃，例如：

在知識庫中建立新關係：如圖5，建立一個新結構Indirect-Room-Connection，而且它是Room-Connection的子類別。這是經由推理得出的新關係：廚房和臥室不是直接連接的。
查詢知識庫：自主機器人透過Room-Connection的類別繼承(Type Inheritance)，即可從知識庫中查知廚房和臥室之間是間接連接的關係。
通過門離開：如圖6，自主機器人執行稱為Go-to-Adjacent-Room的初始任務，而實際執行者是Exit-Via-Door。
到達臥室：一旦到達客廳，自主機器人會再製定另一個計劃，藉此到達臥室。這次，它是執行稱為Goto-Other-Floor的初始任務，而實際執行者是Exit-Via-Stair。

圖3 一個任務規劃模型的知識庫架構：矩形代表實體，菱形代表關係

圖4 廚房透過門與客廳相連，客廳透過樓梯與臥室相連

圖5　以Indirect-Room-Connection規則推測1號和3號房間是間接連接的(虛線代表推理得出的關係)

圖6　自主機器人從廚房移動到客廳的任務規劃模型的部份架構(不包含到達臥室的初始任務Goto-Other-Floor和實際執行者Exit-Via-Stair