OUTLOOK 科技發展觀測平台

焦點報導

首頁> 焦點報導清單> 2024年人工智慧領域之新興技術：多模態神經網路、可解釋人工智慧、自主邊緣

2024年人工智慧領域之新興技術：多模態神經網路、可解釋人工智慧、自主邊緣

薛孝亭/ 發布日期：2024/09/27/ 瀏覽次數：1514

一、前言

Frost & Sullivan在評估市場潛力、專利申請、募資狀態、2024年主流趨勢、經濟影響力等關鍵要素後，於人工智慧科技領域中，評選出多項未來2-4年內將對社會產生重大影響的新興技術，包括：多模態神經網路(Multimodal Neural Networks)、可解釋人工智慧(Explainable AI, XAI)、自主邊緣(Edge Autonomy)等。本文將針對前述3項新興技術，分述其定義、應用範疇、技術特點、代表性案例等(各項新興技術摘要與發展潛力請參閱圖一)。

二、多模態神經網絡(Multimodal Neural Networks)

多模態神經網絡(Multimodal Neural Networks)為一種先進的人工智慧技術，能模擬人腦的資訊處理方式，將多種不同類型的數據與資料(如文本、語音、圖像和影片)進行綜合分析，以提高分析的準確性和全面性。

(一) 技術優勢與影響
多模態神經網絡的核心特點是能夠分析多種來源的異質資料，並從中提取相關特徵進行綜合判斷與分析。主要優勢包括：提升分析的全面性，並且能從複雜的多模態數據找出關聯性，減少單一類型數據可能引起的偏差；具備優異的適應性，能克服資料類型的限制，適用於更廣泛的應用場景；另外，多模態數據能提升數據的完整性，從而在學習過程中彌補數據缺失問題，提供更高品質的分析結果。

多模態神經網絡應用範疇廣泛。Frost & Sullivan評估多模態神經網絡在2024-2028年間將會對醫療、娛樂、汽車等產業帶來劇烈衝擊。在醫療產業方面，多模態神經網絡可以將患者的醫療影像、病歷和基因等醫療數據統整分析，提供更精確且更適合患者的治療建議，或者能將患者生命體徵、照護、監測與病歷等數據整合，實現個人化照護與疾病監測。在娛樂產業方面，多模態神經網絡能整合視覺、聲音、文字等數據，提供更身臨其境的遊戲體驗。在汽車產業方面，多模態神經網絡能結合光達、雷達、攝影機等裝置的偵測數據，以及駕駛使用習慣與車子性能等數據，發展出更加安全的先進駕駛輔助系統。

(二) 發展趨勢
目前許多業者正積極發展多模態人工智慧模型與解決方案，例如Google的Gemini AI、微軟的Copilot解決方案、NVIDIA的Clara平台。未來多模態神經網絡的發展趨勢將著重於運算效率的突破和技術標準化等主軸。訓練與運算成本高為目前多模態類神經網路發展的重大挑戰，Frost & Sullivan預計2024年底前將出現能大幅提高多模態數據運算效率的演算法模型，以大幅度降低多模態神經網絡的訓練和部署成本。此外，預計2025-2028年間全球對於人工智慧的監管法規將會逐漸完善，且道德與資料隱私等問題將會陸續被克服。健全成熟的人工智慧法規將對促進業界對多模態神經網絡的採用，並且加速其發展。

(三) 代表性案例

(1) 醫療領域多模態AI平台
開發廠商：美國NVIDIA
NVIDIA的Clara平台是一款專門針對醫療領域的AI與數據平台，可將醫療影像、基因體學和電子病歷等多模態數據整合分析，提供全面的診斷和治療建議。例如：Clara平台能於手術中整合影片和感測器等資料，並即時為醫師提供見解，幫助醫師在手術過程中能立即做出治療判斷。此外，Clara平台還能應用於藥物開發以及基因體研究等生醫領域。

(2) 多模態AI解決方案
開發廠商：美國微軟
Microsoft 擁有多種結合多模式神經網路的 AI 解決方案，例如 Azure 認知服務，能夠將視覺、語音、語言和決策功能嵌入到開發者的產品中。另外，微軟亦積極與 OpenAI展開合作，使微軟能夠將OpenAI開發的GPT4 模型納入其 Bing搜索引擎和Copilot解決方案中。

三、可解釋人工智慧(Explainable AI, XAI)

可解釋人工智慧(Explainable AI, XAI)的核心理念是提供能夠解釋AI模型運作原理和結果的工具，從而幫助用戶了解AI在做出特定決策時所依據的邏輯，以提升AI模型的透明性，幫助開發者提高AI分析的準確性與消除偏差，進而提升AI模型的可靠性。同時XAI 技術還可以幫助組織確保AI是否有按照要求運作，以維持決策品質並且滿足監管要求。

(一) 特色與優勢
常見的XAI技術包括：SHapley Additive exPlanations (SHAP)、Local Interpretable Model-agnostic Explanations (LIME)、Deep Learning Important FeaTures (DeepLIFT)等，以下分別介紹前述各項技術之特色與優勢。

(1) SHAP
SHAP的原理為計算樣本每項特徵對AI模型輸出結果的貢獻度，以解釋各項特徵在決策過程中的重要性。其優點在於有助於使用者理解AI模型的整體決策流程，且適用於各種AI模型。

(2) LIME
LIME方法則會先修改輸入資料的部分數據，產生與原始輸入相似但不完全相同的擾動數據，再分析擾動對AI模型決策的影響，找出影響此次決策的關鍵特徵。此方法適合用於解釋特定資料的預測結果，但解釋範圍有限，難以解釋模型的整體決策行為，且結果可能因不同的擾動而變化。

(3) DeepLIFT
DeepLIFT原理為追蹤類神經網路運算過程中，每個類神經元的活化狀態，以精確地描述每個類神經元在運算期間的交互作用與影響，進而提供清晰的模型解釋。

(二) 發展趨勢
為了提升AI的可靠度，許多業者致力於發展XAI 解決方案，例如微軟發推出包含多款XAI的工具包-InterpretML，供客戶使用；富士通與Informa D&B合作，將富士通的XAI解決方案應用於Informa D&B的商業金融資料庫分析。隨著人工智慧逐漸的普及，全球業者對於XAI的需求和關注度也在不斷增加。未來的技術發展將集中在標準化、與雲端技術的深度整合以及成本與效率的提升等面向。目前各國政府和監管機構正在制定人工智慧相關法規，此趨勢將驅使業者將XAI逐漸納入公司的負責任人工智慧指南中，以滿足法規的要求。同時，預估在2025-2027年間，XAI技術將逐漸與雲端計算平台進行整合，使業者能夠大規模地部署XAI，幫助其負責任地使用AI，並且檢測AI模型的異常情況。隨著XAI技術的發展，預計2028時，XAI的分析準確性將大幅提升，並且能精準地追蹤AI分析與決策流程，同時能因應業者需求發展出優化的XAI解決方案。此現象將能促使更多業者採用XAI技術，並且擴張XAI的應用範疇。

(三) 代表性案例

(1) 提供多款解釋工具的XAI解決方案
開發廠商：以色列Ctirus X
CitrusX致力於為企業提供透明且可解釋的AI解決方案。其XAI技術平台能夠在AI模型的開發和運行過程中，及時提供模型的解釋，包含：對AI模型的全面性解釋，以幫助使用者理解模型的整體行為；或者深入分析個別數據，評估數據的差異是如何對AI模型決策產生影響；同時能將AI模型相似的決策表現進行歸類，幫助業者進一步優化決策過程；並且預測新樣本對AI模型的影響，幫助使用者評估AI模型輸出的可靠性。此外，CitrusX的解決方案還能夠檢測和消除AI模型中的偏差，可避免歧視性結果，確保AI模型符合道德和公平。

(2) 完整計算各特徵因果關係並提供解釋的AI平台
開發廠商：日本富士通
Fujitsu Kozuchi 為Fujitsu 推出的雲端AI平台，此平台由多項應用類型的AI解決方案組成，包括生成式 AI解決方案、AI模型開發輔助工具、XAI解決方案等，以幫助使用者快速開發、測試和使用AI。其中， XAI 解決方案能在大量的數據資料中，快速且詳細地計算各項參數在不同條件下的因果關係，以完整地解釋AI的決策流程。

四、自主邊緣(Edge Autonomy)技術

自主邊緣(Edge Autonomy)技術能讓邊緣裝置具備自主蒐集、即時處理與分析數據以及進行決策的能力，而不需將大量數據傳輸至雲端，並且仰賴雲端資料中心進行計算。

(一) 特色與優勢
自主邊緣技術具備以下數項優勢：

(1) 低延遲與降低成本：在邊緣裝置處理數據，僅將必要的訊息傳送到雲端，有助於減少網路頻寬的需求並且降低運營成本，同時得以免除將大量數據傳輸至雲端運算中心的時間，能實現低延遲甚至即時反應，對於需要迅速回應的應用場景如智慧交通或工業自動化特別有利。

(2) 提升隱私與安全性：由於數據在邊緣裝置上處理，減少了數據傳輸過程中隱私與敏感性資料洩漏的風險，從而提高了數據隱私和安全性。

(3) 加速AI訓練：此技術亦能立即將感測器等裝置新生成的數據用以訓練AI模型，進而得以迅速提升系統整體效能。

(二) 發展趨勢
目前自主邊緣技術關注的重點在於提高邊緣裝置的運算效率，減少延遲，並且降低運算實施需要的能源消耗。例如荷蘭Axelera AI的Metis AI平台以及Google開發的Coral Edge TPU。另外，近期5G技術的普及帶動了自主邊緣技術的迅速發展，預計2025年後，5G將會逐漸與邊緣自主裝置整合，進一步降低自主邊緣裝置回應的延遲時間。另外，隨著AI技術以及TPU(Google 開發專門用於加速機器學習的處理器)等晶片的迅速發展，預計2027年後，以先進大型語言模型(LLM)為基礎的自主AI (autonomous AI)將會變得更加普遍，並且能與邊緣裝置的AI協作，共同建構成複雜多層次的自主運算環境，從而得以高效率地完成繁複的任務。

(三) 代表性案例

(1) 高效能的邊緣人工智慧處理器
開發廠商：荷蘭Axelera AI
Axelera AI專注於開發高效能邊緣人工智慧（Edge AI）處理器，其核心技術平台為 Metis AI，此平台的先進設計能在提供強大計算能力的同時，有效降低功耗，此優勢對於需要長時間運行且能源受限的邊緣設備來說尤為重要。另外，Metis AI 平台亦支持主流的機器學習框架，如 PyTorch 和 TensorFlow，開發者可以輕易地將已有的AI模型部署到 Metis AI 平台上，而無需重新訓練。同時Axelera AI開發的Voyager SDK解決方案能簡化AI的開發流程，並且含有多款AI模型，讓開發者能夠快速的開發出符合需求的邊緣AI裝置。

(2) 能於外科手術時提供人體內部即時影像之邊緣AI技術
開發廠商：美國 Activ Surgical
美國Activ Surgical開發能用以提升外科手術的安全性與精確性的先進邊緣AI技術-ActivSight Intelligent Light。此項技術能夠在手術過程中，為外科醫生提供人體內部的即時影像，使醫生能夠觀察肉眼無法看到的關鍵生理結構和功能(如血流)，幫助醫師更精確地進行判斷，從而提高手術的成功率。
近期，Activ Surgical已陸續在全球多家醫療機構中使用(如約旦Abdali 醫院)，同時該Activ Surgical也在不斷拓展其技術的應用範圍，包括大腸癌手術、減重手術等。

延伸閱讀

資料來源

Frost & Sullivan / Top 50 Emerging Technologies: 2024 Edition
Frost & Sullivan / AI: Global Megatrends and Ecosystem Growth Opportunities
Frost & Sullivan / Growth Opportunities in Artificial Intelligence, Generative AI, Immersive Technology, Blockchain and Metaverse