焦點報導

首頁> 焦點報導清單> 生成式AI之應用趨勢

生成式AI之應用趨勢

邱珮芸、高飛、林姿伶/ 發布日期:2023/06/01/ 瀏覽次數:1679

一、前言

隨著科技的發展,AI人工智慧和深度類神經網路(Deep Neural Network , DNN)技術的應用越來越普遍,它們可協助人類完成瑣碎的工作和雜務、節省時間,讓人類更致力於創造力和想像力的工作任務。生成式AI是一種強大的技術,它可以從限定的輸入模式生成全新或類似的媒體內容,在訓練階段,生成式AI模型會對資料的獨特性和重要性進行解釋和判斷,因此,這些模型的結果不受人類經驗、偏見及心理影響,但生成式AI也只能在訓練資料設定的範圍內,創造更好的作品,無法憑空生成新的文件或圖片。下圖分別為生成式AI應用模式、生成式AI廠商及其AI模型。

 

 

 

二、常用技術

生成式AI模型可使用少量的潛在向量(Latent Vectors)來生成接近原始資料的素材,創造素材的新式樣,廣泛應用於文字、圖像、視覺影音資料。下列將說明生成式AI常用技術。

(一)生成對抗網路(Generative Adversarial Networks, GAN)
GAN是由兩個神經網路組成的模型,一個生成器和一個鑑別器,生成器也稱為生成網路,是負責產生與原始資料類似的新資料或內容之神經網路,鑑別器也稱為鑑別網路,是區分原始資料和生成資料之神經網路,透過模型的反覆訓練,提高性能,用於生成圖像、音頻、文本各種類型的資料。

(二)Transformer模型
Transformer模型主要功效為分析具有順序結構的資料,像是句子的單詞順序,現在該技術已經成為自然語言建模的標準工具,能夠處理輸入序列到序列(Sequence-to-Sequence)任務,並且計算該序列的表徵(Representation),提供自然語言翻譯、語音辨識的功能。

(三)自回歸卷積神經網路(Autoregressive Convolutional Neural Networks, AR- CNNs)
AR-CNNs是依據先前觀察到的序列結果來預測序列的未來結果,用來探索時變系統(Time Variant System),並認為特定資料的概似性(Likelihood),以建立可靠的新資料。AR-CNNs 還可以透過自回歸(Autoregressive)機制來生成高品質的資料。

(四)貝氏網路(Bayesian Network)
貝氏網路是一種生成機率圖形模型,可以有效的表示一組隨機變數的聯合機率分配(Joint Probability Distribution),應用於時間序列預測、異常檢測、推論等各種模式。

(五)高斯混合模型(Gaussian Mixture Model, GMM)
GMM是一種高斯分布的生成機率模型,能夠對資料點在特徵空間中的密度進行聚類分析(Cluster Analysis),常用於生物辨識系統的特徵機率分配之參數模型,像是語音辨識系統的各聲道訊號頻譜分量。

(六)隱馬爾可夫模型(Hidden Markov Model, HMM)
HMM是一種統計模型,可描述內部因素的可觀察事件演變(內部因素是指影響觀察序列的隱藏狀態,這些狀態是不可直接觀察到的,只能透過觀察序列而間接推斷得到)。該模型可以對相鄰符號、域或事件之間的相關性進行建模。HMM已廣泛應用於各個領域,尤其是在語音辨識和數位通訊等各種應用模式。

(七)隱含狄利克雷分布(Latent Dirichlet Allocation, LDA)
LDA 是一種生成機率模型,具有離散資料的集合,例如文字語料庫(Text corpus),這個模型適用於協同過濾(Collaborative Filtering)和以圖片內容進行檢索。

(八)變分自編碼器 (Variational Autoencoders, VAEs)
VAEs是一種無監管學習方法,也是目前最流行的複雜分布建模方法之一,其建立在標準函數逼近器之上,標準函數逼近器是神經網路,可以用隨機梯度下降法(Stochastic gradient descent, SGD)進行訓練,可以用於手寫數字、人臉、CIFAR圖片資料集、以靜態圖像預測未來圖像等各種應用模式。

 

三、應用領域

生成式AI可應用於文本、圖像、音訊和影片創作等用途,下列將說明其潛在應用領域。

(一)醫療保健
生成式AI在醫療保健領域,可藉由模型生成的「合成資料(Synthetic Data)」來增強真實訓練資料,提高診斷準確性,協助醫生更瞭解病人情況,幫助檢測和治療罕見疾病,提高臨床試驗效率,加快新藥物和診斷方法的研發速度,也能夠幫助學生提高臨床技能和專業素養;然而,如果模型資料的來源與實際患者人群不一致,合成資料可能產生偏差;因此,需要謹慎並仔細檢查可能導致不同影響的偏見可能性,以確保醫學解釋的準確性和可靠性。

(二)基礎科學
生成式AI廣泛應用許多科學領域,將在科學家與AI合作中發揮重要作用,進一步拓展人類所能理解的領域。在蛋白質生成模型方面,可協助找到新型蛋白質,進而研發出有效的新藥物;在量子領域方面,生成式AI可促進材料科學和量子化學的發展,進一步推動科學研究發展;在大規模流體力學模擬方面亦具有應用價值,有助於更深入地瞭解氣候變化及其影響;後續,科學家也希望將AI與神經科學結合,進一步探索物理世界對心智世界的影響。近年來,科學家為了評估AI在各領域的能力和風險,開發出HELM工具,對30多個著名語言模型進行全面評估,進一步幫助科學家們擬定政策,確保AI在未來的發展過程中,不會對人類帶來威脅和危害。

(三)藝術人文與社會科學
生成式AI實現了各種藝術人文形式,過去,生成視覺化圖表需要技術人員花費幾個小時進行資料的搜索和編寫作業,現在,藉由AI的協助,在幾秒鐘內即可完成這項任務;同樣,生成式語言模型能夠幫助市場行銷和文案撰寫人員創造更好的措辭和短文。雖然,生成式AI帶來許多商業機遇,但創意歸屬、真實性、版權問題也伴隨而來,不僅讓真假辨析變得困難,也對創意產業構成威脅、產生社會影響。

(四)教育
大型語言模型應用於教育領域,學生可以自訂進度進行學習,探索他們感興趣的話題,突破傳統課程的學科界限;然而,目前的AI模型可能會對學生的表現產生負面影響,削弱他們的創造力;因此,需要訂定相關規範,限制自動寫作工具在教育場合的使用範圍,在不影響學生創造力和學習品質的前提下,善加利用這些技術。

(五)媒體娛樂
生成式AI在媒體和娛樂的應用包含電影修復、動畫模型生成以及音訊合成。生成式AI可以將影片提高到4k及以上的畫質、減少噪音,並將黑白轉換為彩色;若利用AI演算法在電腦遊戲中建立3D模型,可大幅減少軟體開發人員的工作時間;生成式AI還可以創建人聲效果、環境音效、配音的音色音質,用於電影和遊戲場景,或是幫助創作影片的配音、音訊剪輯和旁白。

(六)零售和電子商務
在零售和電子商務方面,生成式AI可協助業者評估消費者的文字訊息、音訊樣本及面部表情,從而了解客戶對產品的態度,還能瞭解線上消費者的使用者體驗狀況,藉以評估廣告、營銷活動的效果。

(七)資訊科技
資訊科技產業的應用包含軟體開發、資料合成與擴增。技術人員現在不需要編寫軟體全部的程式碼,而可以透過生成AI,解釋其模型需求,協助開發軟體產品,也可以使用生成式AI擴增的資料,提高資料品質,並用於測試新的機器學習演算法或深度學習架構。

 

四、結語

資料安全性與結果準確性是生成式AI目前最大的挑戰:在資料安全方面,若缺乏用於資料監管之相對應參數,可能會引發資料安全和隱私問題,在醫療保健、國防產業更需要審慎使用該技術;另在使用生成式AI的過程,若演算法和模型處理不當,可能會產生錯誤或出乎意料的結果,導致結果的準確度偏差;因此,生成式AI的未來發展,其演算法和模型仍需持續升級,以因應不斷變化的應用模式和需求,並且在法律政策的監管下實行,減少文化和社會影響,保障公眾利益和個人權益。

延伸閱讀
資料來源