焦點報導

首頁> 焦點報導清單> 資料科學與機器學習平台評比

資料科學與機器學習平台評比

蔡玉琬/ 發布日期:2019/05/13/ 瀏覽次數:108
Gartner自全球70個已開發出資料科學與機器學習平台的企業中,挑選具備整套開發資料科學與機器學習解決方案的基礎材料,且能夠將資料科學解決方案設置於商業流程、環境基礎架構、應用程式與產品的平台,以及能讓資料科學團隊建立客製化解決方案。其邀請547個組織對具備上述能力的17個平台進行使用者意見調查(因缺乏Amazon Web Services、Big Squid、FICO、MicroStrategy、Teradata與World Programming等平台資料,故這些平台不在評估範圍),並依據15項評估指標進行評比。以下將說明科學與機器學習平台未來的發展預測,以及整體評分較高的TIBCO Software、RapidMiner與大眾較熟悉的IBM (Watson Studio)與Google。

一、 未來發展預測
至2020年:有超過40%企業將在商業智慧(Business Intelligence)與分析市場中,增加在預測型數據分析(Predictive Analytics)與指導型數據分析(Prescriptive Analytics)方面的投資;超過40%的資料科學工作將被自動執行,預計將因此提高產出,並驅使更多公民資料科學家(Citizen Data Scientists)使用資料科學與機器學習平台;85%資訊長(CIO)將透過購買、開發或外包(outsource)的方式推動人工智慧試驗計畫。
至2024年:欠缺資料科學家將不再成為阻礙企業推動資料科學與機器學習相關計畫的因素。

二、 TIBCO Software
經歷過一連串的企業收購,TIBCO已建立相當完整且有力的分析平台,主要的產品包含:企業報表與商業智慧平台,如Jaspersoft與Spotfire;描述型數據分析(Descriptive Analytics)與預測型數據分析平台,如Statistica與 Alpine Data,以及串流分析(streaming analytics),如StreamBase Systems。其在銀行業、製造業與天然資源利用產業有相當好的市場滲透率。在平台功能表現方面,該公司產品在彈性與開放性、可攜性、計畫管理與協調的指標有傑出的表現。受訪者認為,TIBCO相當容易操作、使用價格合理,以及具有高度靈活性。平台使用者以商業分析師最多,占35%,次之為資料科學家28%、統計學家16%、資料工程師15%以及開發者6%。約有70%使用者在公司端(on-premises)進行操作。

三、 RapidMiner
RapidMiner平台包含:作為模型開發工具的RapidMiner Studio(免費版與商用版)、可作為分享、協作與維護模型的RapidMiner Server、可自動建立模型的執行程式與資料庫的RapidMiner Cloud、提供低延遲性的模型執行引擎RapidMiner Real-Time Scoring,以及可在儲存與管理大量資料的雲端平台Hadoop直接執行RapidMiner指令的RapidMiner Radoop。其被應用在許多產業,不過在服務業、製造業與銀行業方面有較高的使用率。在平台功能表現方面,在資料取得、使用者介面、機器學習、彈性與開放性的評比獲得相當高的評價。使用者認為產品優勢在於操作容易、模型開發速度與可管理大量模型。平台使用者以資料科學家最多,占36%,次之為商業分析師23%、資料工程師14%。約有60%使用者在公司端操作。

四、 Google
Google Cloud Platform (GCP)提供的機器學習平台包含Cloud ML Engine、Cloud AutoML、開放原始碼的TensorFlow與近期的BigQuery ML,產品特別著重於可擴充性、最新的機器學習與對開發者友善。在平台功能表現方面,在彈性與開放性、擴充性與機器學習獲得相當高的評價。不過對資料科學家而言,該產品在使用Google Cloud ML與TensorFlow方面的技術門檻較高,因其提供的工具通常為開發者所使用的工具,且工具眾多並不易學習。使用者認為該平台的優勢在於產品未來發展路徑圖,特別在深度學習領域,以及產品品質、模型開發速度與可管理大量模型。平台使用者以資料科學家最多,占33%,次之為開發工程師28%(為所有平台中,開發工程師占使用者比例最高的平台)、資料工程師15%。此平台並無全公司端操作的功能,不過有高達75%使用者偏好僅在雲端操作。

五、 IBM (Watson Studio)
Watson Studio是建立在Data Science Experience (DSX)的平台,其強調彈性、支援原始碼與模型運作,並能提供軟體即服務(SaaS)的解決方案,其在服務、電信與金融服務業的使用最為普遍。在平台功能表現方面,在協調性、彈性與擴充性、開放性與使用介面獲得良好的評價,不過在資料探索與視覺化方面相當有待加強。使用者認為IBM WS的優勢在於支援開放原始碼、產品未來發展路徑、模型開發速度與能管理大量模型。平台使用者以資料科學家最多,占43%,次之為開發工程師19%,且多偏好在雲端應用,占43%,雲端與公司端混合應用則占33%。
延伸閱讀
資料來源