2024被視為是生成式AI(GenAI)落地應用大爆發的一年,各領域業者陸續將GenAI技術導入傳統AI產品中,透過GenAI「生成」的能力,持續提升資料價值。台鋼集團子公司力新國際近期與資策會數位轉型研究院合作,透過數轉院AI技術資源,將其OCR企業單據辨識系統從AI-OCR升級為GenAI-OCR。
資策會數轉院院長林玉凡表示,傳統AI和GenAI各有優勢:傳統AI技術能夠確保精準度,適合進行辨識、分類、執行推薦和範圍內預測等任務;GenAI則具有更優秀的理解力和創造力,適合負責創造內容並對資料進行分析解釋。結合兩者,將可打造出更全面的智慧方案,讓同樣的資料發揮更高價值。
林玉凡說明,此次和力新國際的合作推出的GenAI-OCR能夠理解單據,實現欄位自動標註,並在收到資料後判斷影像品質優劣。此外,GenAI-OCR可整理眾單據資料,提供對於企業真正有價值的資訊。林玉凡指出,加入GenAI技術將原本的OCR系統從辨識升級為智慧理解,並可進一步為企業帶來加值服務。
力新國際董事長李雲琴表示,GenAI-OCR應用流程可分為三個階段:預處理(Preprocessing)、特徵提取(Extraction)、分類和識別(Finetune)。首先,將針對單據進行預處理並自動進行文字區塊框選;接著,可快速從經過預處理的資料提取特徵,透過知識庫以提示工程(Prompt Engineering)訓練LLM模型;最後,將進行分類和辨識,透過特徵提取結果,提交相對應關鍵值(Key&Value)
GenAI-OCR展示既有AI產品在導入生成式AI技術後帶來的應用突破,不僅可快速辨識各種文字和圖像格式,也具有高度的自適應能力,能根據不同產業和應用場景進行定制化設定。未來,不只是OCR,在各式應用上皆有機會看到生成式AI大放異彩,和傳統AI技術攜手定義全新資料價值。