2024-10-22 | 美通社

IBM推出新一代企業AI模型Granite 3.0 開啟「小模型 ‧ 高性能」時代

新的Granite 3.0 8B與2B 語言模型具備高性能、透明度與安全性
搭配企業數據在特定任務場景展現優異性價比

台北2024年10月22日 /美通社/ -- IBM 在美國時間10月21日舉行的TechXchange 年度技術大會上，發表了自家旗艦級模型系列第三代 Granite 3.0；它經由寬鬆的Apache 2.0許可發布，在眾多學術與行業評比測試中，均超越或與類似規模的競者模型並駕齊驅，展現了優異的性能、建模彈性、透明度與安全性。

IBM 發表新一代企業級AI模型 Granite 3.0開啟「小模型 ‧ 高效能」時代

IBM Granite 3.0系列模型包括：

通用/語言模型：Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
護欄與安全模型：Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
專家混合模型：Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

IBM Granite 3.0系列模型的主要特點：

適合性：許多大語言模型（LLM）是基於可用的公開數據訓練而成；絕大多數的企業內部數據未被使用。Granite 3.0 8B與2B被設計為企業級AI的主力模型，可為檢索增強生成（RAG）、分類、摘要、實體提取、工具使用等企業任務，提供強大的性能。這些小巧、多功能模型可以根據企業數據進行微調，與業務場景或工作流程無縫整合。
性能：在Hugging Face的OpenLLM排行榜評比測試中，Granite 3.0 8B Instruct模型的整體性能，平均領先Meta與Mistral類似大小的開源模型的最佳性能。在 IBM 的AttaQ 安全評比測試中，上述模型在所有受測的安全維度裡，表現均優於Meta與Mistral的模型。

在這次發布裡，還有專家混合架構（Mixture of Experts, MOE）Granite 3.0 1B-A400M與Granite 3.0 3B-A800M，這些較小型、輕量級的模型可建置在傳統CPU伺服器，用於低延遲應用程式，兼顧性能與推理成本的完美平衡。

IBM還發布了預訓練Granite 時間序列模型的更新版本。這些新模型基於多三倍的數據量訓練，具備更高的建模彈性、支持外部變量與滾動預測。在三個主要時間序列模型評比中，Granite 的性能超越了Google、阿里等規模大十倍的模型。

成本：在特定任務上啟用小型 Granite模型，搭配企業自有數據，加上使用 IBM 與 RedHat 在今（2024）年五月推出的革命性對齊技術InstructLab，企業獲得的效能與使用其他大型模型相同，但成本大幅降低。（根據數個早期概念驗證案例進行的成本分析結果顯示，成本減少約3至23倍）
透明度：Granite 3.0技術報告與負責任使用指南，均詳細描述了訓練這些模型的數據集、所採用的數據過濾、清洗與處理步驟；並詳列它們在主要學術與行業評比測試裡的性能結果。
法律保障：IBM 為watsonx.ai 平台上的所有Granite 模型提供智慧財產權賠償保證，強化企業客戶採用此模型的信心。
安全性：IBM 推出新的 Granite Guardian 模型系列，應用開發人員可以透過檢查使用者提示與LLM回應來建置「安全護欄」，提前發現各種風險。Granite Guardian 3.0 8B與2B模型，提供了目前市面上最完整的風險與危險檢測功能；也可與任何其他開放或專用的AI模型共同使用，強化AI安全保護機制。
負責任：除了偏見、仇恨、髒話、褻瀆、暴力、嘗試破解限制等AI危害指標，Granite Guardian模型還提供了獨有的RAG特定檢查，例如是否基於事實、與上下文的相關性、與答案的相關性等。在針對安全性與RAG標準的19項廣泛測評中，Granite Guardian 3.0 8B模型對於危害檢測的整體準確性，平均優於Meta既有三個版本的Llama Guard 模型；它接受幻覺檢測的整體表現，也與專門用於幻覺檢測的模型WeCheck和MiniCheck相當。
包容性：Granite 3.0 模型使用超過12萬億個標記的數據量訓練而得；數據來自12種不同的自然語言，與116種不同的程式語言，採用了新式的兩階段訓練方法，引用了數千個優化數據品質、數據選擇、與訓練參數的實驗結果。預計到今（2024）年底前，Granite 3.0 8B與2B模型將支持擴展到128K上下文窗口和多模型文件理解能力。
開放性：全Granite 3.0模型組與更新版的時間序列模型，均可在HuggingFace上根據寬鬆的Apache 2.0許可證下載。新的 Granite 3.0 8B 和 2B 語言模型的指令變項、以及 Granite Guardian 3.0 8B 和 2B 模型，已在 IBM watsonx 平台商用。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務提供，並通過 Google Cloud 的 Vertex AI Model Garden與 HuggingFace 的整合提供。

為了向開發人員提供多種選擇和易用性，並支持本地和邊緣應用，精選的Granite 3.0 模型也可在Ollama 和Replicate 上取得。新一代Granite 模型擴充了IBM 強大的開源LLM 目錄：IBM 與AWS、Docker、Domo、Qualcomm Technologies Inc.（通過其Qualcomm AI Hub）、Salesforce、SAP等合作夥伴合作，將多種Granite 模型整合在它們的產品中或平台上。

IBM 同時宣佈將 Granite 3.0 設定為 IBM Consulting Advantage AI賦能服務平台上的預設AI模型。全球16萬位 IBM 諮詢顧問可以在各種客戶應用場景裡，如客戶服務或IT現代化，輕鬆方便地應用Granite 模型，更敏捷、高效、經濟地為客戶提供商業價值。

瞭解關於 Granite 和 IBM 企業級AI策略，請造訪 https://www.ibm.com/granite

關於 IBM
IBM 是全球領先的混合雲、人工智慧及企業諮詢服務的提供者，為全球超過175 個國家的客戶服務，協助其從擁有的資料裡獲取商業洞察、簡化業務流程、降低成本，並取得產業競爭優勢。來自金融服務、電信和健康醫療等關鍵基礎設施領域、超過4千家政府和企業機構，採用IBM 混合雲平台和Red Hat OpenShift 解決方案，快速、高效、安全地實現企業數位轉型。IBM 在人工智慧、量子運算、產業專屬的雲端運算解決方案和企業諮詢服務領域的突破性創新，為客戶提供開放和靈活的選擇。IBM 對企業誠信、透明治理、企業社會責任、多元與包容文化和服務精神的承諾，歷久彌新，是IBM 業務發展的基礎。

台灣IBM 公司新聞室：https://taiwan.newsroom.ibm.com/

新聞聯絡
IBM 公司公關部 Kate Liu kateliu@cn.ibm.com

新聞關鍵字： AI、 IBM、 google、 NVIDIA、人工智慧、伺服器、美國、語言

IBM推出新一代企業AI模型Granite 3.0 開啟「小模型 ‧ 高性能」時代

最新國際新聞

窮國退出COP29協議諮詢會議氣候談判瀕臨瓦解

曾占俄庫斯克州1376平方公里烏克蘭已丟失逾40%

教宗婉拒出席巴黎聖母院重開典禮改訪法國科西嘉島

中研院法研所長李建良亞洲首獲德耶拿大學榮譽博士

這尊很純！警察緝毒搜出「地精石雕」一驗居然是由搖頭丸製成

延伸閱讀

吳志中參加柏林安全會議傳達台灣和平行動方案

不滿COP29提案 300多NGO聯手籲開發中國家退出協商

以色列空襲與戰車開火加薩民防機構：19死含6孩童

以色列空襲貝魯特市中心造成至少11死63傷

中國COP29進退兩難想領導氣候議題卻不願多出錢

IBM推出新一代企業AI模型Granite 3.0 開啟「小模型 ‧ 高性能」時代

最新國際新聞

窮國退出COP29協議諮詢會議 氣候談判瀕臨瓦解

曾占俄庫斯克州1376平方公里 烏克蘭已丟失逾40%

教宗婉拒出席巴黎聖母院重開典禮 改訪法國科西嘉島

中研院法研所長李建良 亞洲首獲德耶拿大學榮譽博士

這尊很純！警察緝毒搜出「地精石雕」 一驗居然是由搖頭丸製成

延伸閱讀

吳志中參加柏林安全會議 傳達台灣和平行動方案

不滿COP29提案 300多NGO聯手籲開發中國家退出協商

以色列空襲與戰車開火 加薩民防機構：19死含6孩童

以色列空襲貝魯特市中心 造成至少11死63傷

中國COP29進退兩難 想領導氣候議題卻不願多出錢

窮國退出COP29協議諮詢會議氣候談判瀕臨瓦解

曾占俄庫斯克州1376平方公里烏克蘭已丟失逾40%

教宗婉拒出席巴黎聖母院重開典禮改訪法國科西嘉島

中研院法研所長李建良亞洲首獲德耶拿大學榮譽博士

這尊很純！警察緝毒搜出「地精石雕」一驗居然是由搖頭丸製成

吳志中參加柏林安全會議傳達台灣和平行動方案

以色列空襲與戰車開火加薩民防機構：19死含6孩童

以色列空襲貝魯特市中心造成至少11死63傷

中國COP29進退兩難想領導氣候議題卻不願多出錢