一、前言
2022 年 11 月,OpenAI 推出的 ChatGPT 聊天機器掀起了全球對生成式人工智慧(GenAI)的關注,並促使各產業投入資源,加速GenAI技術在產品、服務和流程創新中的應用。
2024年世界智慧財產權組織(World Intellectual Property Organization, WIPO)發布了生成式人工智慧專利情勢報告(Patent Landscape Report on Generative AI),深入分析了 2014 至 2023 年間 GenAI的專利發展趨勢,內容涵蓋了GenAI關鍵技術的發展動態、核心研究機構的專利活動,以及領先科技業者的布局。報告所使用的專利資料來自美國專利資料庫供應商 IFI CLAIMS Patent Services,其資料庫包含全球55個國家超過1.6億筆專利記錄。本文將依據 WIPO 報告,從技術趨勢、主要專利持有者等面向,解析 GenAI的整體趨勢,並深入探討GenAI模型的發展脈絡。
二、整體概況
(一) 自2017年以來GenAI之專利申請和學術論文發表數量大幅增加
近年來,深度學習技術的突破與運算能力的提升,大幅推動了生成式人工智慧(GenAI)的發展。此趨勢在相關的專利活動與學術研究中均可清楚觀察到。過去十年間,GenAI專利家族數量從2014年的733件攀升至2023年的逾14,000件,成長幅度超過19倍 (如圖一所示)。
在科學刊物方面,GenAI的學術論文數量從2014年的116篇迅速增加至2023年的逾34,000篇,成長幅度逼近300倍(詳見圖二)。近期的研究重點包括縮小大型GenAI模型的規模、提升模型生成內容的精確度和可控性,以及探索GenAI在更多應用領域的潛力。值得注意的是,由於新專利從申請到公開約有1.5年的時間差,因此可以預期在2024年至2025年間,GenAI相關的專利數量將會出現顯著的成長。
(二)中國企業專利數量領先,OpenAI開始積極布局以強化技術優勢
2014至2023年間擁有最多GenAI專利的前十名組織如圖三所示。排名首位的騰訊推出以大型語言模型「混元(Hunyuan)」為基礎的人工智慧聊天機器人,應用涵蓋圖像創作、文案寫作與文本辨識等領域,並利用「混元」為微信等核心產品增添AI功能以提升用戶體驗。第二名的平安保險,則將其GenAI模型應用於核保和風險評估。第三名的百度是GenAI領域的早期參與者,近期推出以大型語言模型(Large Language Models, LLMs)為基礎的AI聊天機器人「ERNIE 4.0」,並且針對資訊科技、交通和能源等多個產業開發多款LLMs。
其他具代表性的科技巨擘包括IBM(第五名)、Alphabet/Google(第八名)、微軟(第十名)。IBM 開發了專為企業打造的 GenAI 平台「watsonx」,特別強調 AI 應用的安全性與合規性。Alphabet 推出的 LLMs「Gemini」,正逐漸與 Google 搜尋引擎、瀏覽器等多項產品整合。微軟不僅對 OpenAI 進行大量投資,也積極展開相關研究,例如開發 InnerEye 醫學影像分析工具,用於偵測異常、診斷疾病和提供治療建議
值得注意的是,作為GenAI領域的領先者,OpenAI在2023年以前並未積極申請專利,這或許可歸因於其早期非營利組織的定位以及對技術共享的重視。然而,隨著OpenAI轉型為營利公司,並面臨來自Google、Meta等科技巨擘日益激烈的競爭,其專利策略也隨之調整。2024年初,OpenAI首度於美國提出六項專利申請,這清楚地表明其已開始積極進行專利布局,以鞏固技術優勢並確保未來的商業利益。
三、GenAI專利趨勢-依模型類型區分
生成式人工智慧(Generative AI, GenAI)已發展出多種主流模型類型,包括生成式對抗網路(Generative Adversarial Networks, GANs)、變異自動編碼器(Variational Autoencoders, VAEs)、大型語言模型(Large Language Models, LLMs)、擴散模型(Diffusion Models)以及自我迴歸模型(Autoregressive Models)等。然而,由於多數專利聚焦於新應用案例(如利用GenAI篩選最合適的駕駛路徑),或僅對Gen AI流程進行概括性描述,而未具體闡述或限定採用的模型類型。因此自 2014 年以來的 GenAI 專利家族中,僅約 25% 的專利能夠明確被歸類於上述五類模型。以下將聚焦於可明確歸類的專利,以更精準地探討GenAI模型架構的發展趨勢。
(一) 生成式對抗網路專利數量最多,擴散模型和大型語言模型近年成長最為顯著
在2014-2023年間的GenAI模型中,生成式對抗網路(GANs)在GenAI模型專利數量最多,專利家族總數約9,700項,其中僅2023年就新增約2,400項(詳見圖四)。變異自動編碼器(VAEs)和大型語言模型(LLMs)則分居第二和第三,同期專利家族數量分別約為1,800項和1,300項。此外,擴散模型和自我迴歸模型的專利家族數量則分別約為600項和400項。
雖然在過去六年(2018-2023年),各模型專利數量皆呈現顯著成長(年均成長率皆超過75%),但GANs、VAEs和自我迴歸模型近三年的專利成長已趨於平緩(近三年年均成長率分別為14.4%、33.4%和42.0%)。相較之下,擴散模型和LLMs的專利申請在同一期間展現出更為強勁的成長,年均成長率分別高達155.2%和190.4%(見圖四)。此一趨勢可能反映出擴散模型和LLMs近年來在技術方面的突破與應用的拓展。
(二) 中國企業在多數 GenAI 模型專利中領先,美國於VAE專利領域展現競爭力
在企業方面,中國騰訊在LLM和擴散模型專利家族中均處於領先地位(專利數分別為96項和25項),其次是百度(65項和19項)。中國的國家電網和平安保險則分別在GANs和自我迴歸模型領域的專利數量上領先(分別為129項和17項)。相較之下,美國企業則在VAEs專利方面表現突出,其中IBM以37項專利數量領先,Alphabet/Google位居全球第二(32項)(詳見表一)。
在研究機構方面,中國研究單位在各GenAI模型領域的專利數量上普遍領先。中國科學院在GANs、VAEs和自我迴歸模型專利數量上位居首位(191項、28項和10項);浙江大學在擴散模型專利數量中領先(20項),而清華大學則在LLM專利中表現出色(19項)(詳見表二)。