面對台灣超高齡社會的嚴峻挑戰,迫切需要生成式AI解決健康照護問題,資策會軟體院發展「以人為本」的智慧照護生態系,從智慧語音摘要到虛擬助理陪伴,從模組化架構設計到場域整合實踐,透過地端部署、資料溯源與隱私保護等機制,確保照護服務的安全性與可靠性,企盼藉由智慧科技導入,為台灣的醫療環境提升服務效率、減輕照護負擔。
根據國家發展委員會2024至2070年人口推估,2025年台灣65歲以上老年人口占比將突破20%,正式進入超高齡社會[1]。伴隨人口老化,台灣的總生育率持續探底,多年位居全球最低。「少子高齡化」的雙重衝擊,使得照護需求與人力供給之間的缺口持續擴大,對健康照護體系形成前所未有的壓力與挑戰:專業人員流動率高、紀錄與行政負擔沉重、服務品質不易維持等。
隨著生成式人工智慧(Generative AI,下稱生成式AI)技術發展,在數位轉型與智慧健康政策推動下,語音辨識、自然語言理解、虛擬互動等應用開始進入照護現場,尤其在記錄輔助、復健訓練與陪伴互動等情境中,展現出具有減輕工作負擔、改善服務體驗與擴展照護規模的潛力[2]。根據麥肯錫2024年第4季對150位醫療領袖的調查指出,已有85%的機構在探索或應用生成式AI,其中實際導入者亦多於僅做概念驗證者;在已實際導入的機構中,64%回報或預期可取得正向的投資報酬率[3]。
本文將聚焦於生成式AI助理於智慧健康照護中的應用,探討其在語音摘要、虛擬互動、模組化架構與場域整合等面向的實踐,說明其如何為未來的照護模式帶來更高效、人性化的創新服務體驗。
智慧語音摘要 記錄不再是負擔
智慧語音摘要以語音辨識與大型語言模型生成技術為核心,已在醫療與照護領域展現出顯著的實用價值。由於語音摘要技術能即時處理醫病對話,並自動生成不同用途的摘要內容,可應用於門診諮詢、病房巡視與手術記錄等情境。智慧語音摘要不僅可將醫師的口頭醫囑轉為標準格式,以避免事後人為誤記,還可根據使用者角色調整語言與資訊重點。如醫護摘要著重於診斷與處置資訊,病患摘要則強調生活照護與用藥提醒等。在長照訪視場域,個管師與訪視員可利用語音摘要整理訪視紀錄,並透過對話內容區分說話角色,快速完成訪視摘要,同時自動轉換為涵蓋身心狀況、服務建議與風險提醒等欄位的長照規範格式報告。未來更可進一步比對過往記錄,分析個案變化趨勢,協助追蹤服務成效,成為提升服務品質的智慧工具。
虛擬助理互動陪伴 溫暖照護過程
3D Avatar是以語音生成與虛擬影像為核心的技術,可創造栩栩如生的虛擬健康助理, 提供自然且具情感溫度的互動體驗。結合檢索增強生成技術(Retrieval Augmented Generation, RAG)與模型微調後,虛擬助理不僅具備健康指導與照護專業知識,更能與使用者建立情感連結,提升使用者參與意願與互動黏著度。
在專業陪伴與復健指導場景中,可生成虛擬健身教練或虛擬復健師,結合運動指導、姿勢糾正與安全提醒等內容,協助使用者正確執行訓練計畫。並可透過人物個性化設定,讓使用者依據偏好選擇互動角色,建立更為流暢的陪伴關係。虛擬助理也能依據使用者訓練進度,即時提供鼓勵語句、進度說明與動作提醒,並搭配唇型動畫與表情動作增強沉浸感。
這類虛擬助理亦可應用於長者認知訓練、服藥提醒與健康教育等多元場景,例如當使用者向虛擬助理表達心情或詢問進度時,系統可根據語意回應動態語音,並同步顯示唇型動畫與表情,有助提升長者或亞健康族群的參與感與持續動機,是醫護人力不足的重要輔助力量,並提供具有溫度的智慧照護新體驗。
模組化核心架構設計 多模態AI整合策略
若為診間問診、居家訪視與復健訓練等多元照護情境, 可以利用生成式A I技術驅動的服務系統,靈活整合語音與數據輸入,並對應不同的角色需求,提供互動回應與摘要服務,如圖1所示。
圖1 生成式AI智慧照護系統模組化架構示意圖
服務系統可同時處理語音對話(如醫病溝通、居家訪視)與設備數據(如心率、生理監測、運動感測器),並支援多語言、多場域混合語音辨識與噪音處理。這些資料將在本地端透過語音辨識模型(Automatic Speech Recognition, ASR)與語言生成模型(Large Language Models/ Vision Language Model, LLM/ VLM),即時轉換為摘要草稿或互動內容文字。語音合成(Text to Speech, TTS)與3D Avatar人像動態合成等技術,可將系統回應文字轉換為具有真實感的虛擬助理互動體驗,提升使用者的接受度與參與度。而互動生成內容經過調整語句風格、重點排序與語意強化等優化過程後,將透過合規知識模組比對衛教知識、診療建議與照護規範,確保資訊的正確性與可靠度。
開發架構設計上也必須具備高度彈性,單一功能可獨立部署或與既有系統串接,以便照護機構依不同應用需求(如僅需生成摘要、僅需語音互動等)彈性採用。同時,輸出內容可依角色(醫護、病患、家屬)調整語言風格與資訊呈現方式,進一步提升系統的易用性與跨場域適應能力。最後,在AI風險管理層面,考量到健康照護資料的安全性與隱私性,系統可採用內部部署架構,所有語音與使用紀錄皆於機構內部處理, 確保資料不上雲端以避免洩漏風險, 而所有生成內容皆具備溯源機制,以提升系統可信度。
導入與應用觀察 技術輔助到場域適配
實務推動方面,智慧語音與虛擬助理等技術已在多個醫療場域進行試點應用。例如敏盛醫療體系導入試行後,能在3分鐘內完成1分鐘的錄音辨識,節省醫護人員近3成的作業時間[4];在衛生局單位與長照機構的試驗中,能有效減少30%以上文書作業時間[5];北部某醫材廠商則是透過復健設備擴充結合IoT、生成AI技術拓展服務應用(圖2),建立從運動評估、個人化訓練、效果回饋到關懷提醒的完整服務流程,且設備會在運動期間提供激勵對話與指導,不僅使長者每日運動完成率提升,對於服務滿意亦獲得正面回饋。
圖2 生成式AI結合IoT的復健服務流程示意圖
上述案例初步顯示,生成式AI技術在提升效率、改善互動品質與促進服務一致性上極具發展潛力,但實務導入仍面臨數項挑戰。例如語音辨識在不同語言與背景噪音條件下的準確率、生成內容的可控性與可靠性、數據隱私保護及各場域IT系統整合的技術門檻。因此,透過「回應溯源」、「摘要標註」、「誤判回報與修正」等功能,提供場域回饋機制與跨單位合作,才能讓使用者與照護團隊建立起對AI照護服務的信任。
人本導向AI照護 智慧照護新生態
生成式AI技術為健康照護領域帶來的創新應用,正在重新定義傳統照護服務的邊界與無限可能。從醫療診療的語音摘要、長照管理的智慧記錄到運動復健的虛擬陪伴,相關應用已逐漸深入健康照護的各個環節。
這項技術創新的意義不僅在於提升工作效率,對於台灣健康照護產業而言,透過導入AI技術,以提升服務品質、降低營運成本、創造新的商業模式,結合技術創新與人文關懷,將是智慧健康照護發展的核心價值與永續推力。
(本文作者吳怡欣為資策會軟體院組長;游柏揚為助理工程師)
參.考.資.料
[1]國家發展委員會「中華民國人口推估(2024年至2070年)報告」,https://ppws.ndc.gov.tw/Download.ashx?u=LzAwMS9VcGxvYWQvNDY0L3JlbGZpbGUvMTAzNDcvMTU0Lzc3NjE1YTRkLTE1OWQtNDljYy1iZGU3LTM5NTQ5ZGM3Mzg4Yi5kb2N4&n=5Lit6I%2bv5rCR5ZyL5Lq65Y%2bj5o6o5LywKDIwMjTlubToh7MyMDcw5bm0KeWgseWRii5kb2N4
[2]「敏盛智慧健康管理中心、方鼎資訊、醫電數位參加醫療科技展 醫錄通語音自動生成醫囑實現智慧化健康管理」,https://www.moneyweekly.com.tw/ArticleData/Info/Article/159683
[3]“Generative AI in healthcare: Current trends and future outlook”, McKinsey&Company, Mar.2025
[4]「語音辨識結合AI打造醫護專用Siri醫錄通 醫電數位轉型減輕現場文書負擔」,https://www.tcloud.gov.tw/article/user-story/11310003
[5]「超高齡社會照護壓力攀升 資策會智慧科技補足長照缺口 以AI打造有溫度的友善社會」,https://www.iii.org.tw/zh-TW/news/newsroom/iii-news/9f0f9af2-381f-4555-b1e9-a80afec12966