IBM Granite 模型家族新成員 Granite 3.2 報到
全新視覺語言模型效能媲美大參數模型推理能力增強更輕巧安全
- Granite 3.2 是小型AI 模型,具備新的視覺理解、更強的推理與更輕巧的安全防護能力;採用對開發者友善的授權條款
- 新一代Granite 時間序列模型可支援長期趨勢與需求預測,參數小於1千萬;適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃
- 體現IBM 發展企業專用、小型、高效與實用AI的策略
台北2025年3月3日 /美通社/ -- IBM於2月底發表其 Granite 大型語言模型家族的最新一代產品 Granite 3.2,持續推動小型、高效、企業專用的 AI,為實際應用創造效益。

IBM 推出 Granite 3.2 大語言模型,體現 IBM 發展企業專用、小型、高效與實用 AI 的策略。
所有Granite 3.2 模型均採用寬鬆的Apache 2.0 開源授權條款,可在Hugging Face 下載。部分模型現已在IBM watsonx.ai、Ollama、Replicate 和LM Studio 上提供,預計不久將支援RHEL AI 1.5,為企業與開源社群注入更強大的AI 能力。
主要亮點
- 全新視覺語言模型:專為理解文件任務而設計,在關鍵企業基準測試DocVQA、ChartQA、AI2D 和OCRBench[1] 上,表現可媲美甚至超越更大規模的模型(如Llama 3.2 11B 和Pixtral 12B)。除了強大的訓練數據外,IBM 也利用其開源Docling 工具包處理8千5百萬份PDF 文件,並生成2千6百萬個合成問答配對,提升視覺語言模型在處理大量文件工作流時的能力。
- 增強推理功能:Granite 3.2的2B與8B模型加入了「思維鏈」(Chain of Thought,CoT)推理機制,且使用者可以開啟或關閉推理功能以優化效率。透過這項能力,8B 模型在ArenaHard 和Alpaca Eval 等指令遵循基準測試中的表現[2],比前一代優異比例達到兩位數,且不影響其他領域的安全性或性能。此外,透過創新的推理擴展方法,Granite 3.2 8B 模型可以調整至接近Claude 3.5 Sonnet 或GPT-4o 在數學推理基準(如AIME2024 和MATH500[3])上的表現。
- Granite Guardian 安全模型更輕巧:在保持Granite 3.1 Guardian 模型性能的同時,模型尺寸減少三成。此外,Granite 3.2 系列還引入了語言化信心評估(Verbalized Confidence)新功能,可提供更精細的風險評估,幫助安全監測系統識別不確定性。
IBM 持續推動企業專用的小型AI 模型策略,並已在測試中展現高效能。例如,Granite 3.1 8B 模型在Salesforce 大型語言模型CRM基準測試中獲得高分,顯示其在實際應用中的準確度和可靠性。
IBM Granite 模型家族擁有廣大的合作夥伴生態體系,許多領先的軟體公司已將Granite模型嵌入其技術。Granite 3.2 是IBM 在推動企業專用小型AI 方面的重要進展,體現了IBM 致力於提供小型、高效、實用AI 的產品策略。
雖然思維鏈在推理任務中表現強大,但它需要大量運算資源,並非所有任務都必須啟用。因此,IBM 在Granite 3.2 模型中加入了程式化開關功能,使用者可以根據需求開啟或關閉推理模式;模型可在不啟用推理的情況下運行較簡單的任務,以降低不必要的運算成本。
此外,其他推理技術(例如推理擴展Inference Scaling)已顯示Granite 3.2 8B 模型能夠在標準數學推理基準測試中,媲美甚至超越更大模型的性能。持續發展這項推理技術也是IBM 研究團隊的重點方向[4],以進一步提升AI 的效能與應用範圍。
除了Granite 3.2 的指令、視覺和防護模型之外,IBM 也推出了新一代TinyTimeMixers(TTM)時間序列模型,這些模型的參數少於1千萬,具備長期預測能力,可進行長達兩年的長期預測。這些模型為長期趨勢分析提供強大工具,適用於金融與經濟趨勢分析、供應鏈需求預測,以及零售業的季節性庫存規劃。
IBM AI 研究副總裁Sriram Raghavan 表示:「AI 的下一個時代將聚焦效率、整合與實際應用的影響力— 企業應該能夠在不過度消耗運算資源的情境下,取得強大的AI 效益。IBM 最新的Granite 模型發展專注於開放型解決方案,逐步推動AI 的普及,使其更具成本效益,為現代企業創造更大價值。」
欲了解Granite 3.2 的技術細節,請參閱相關技術文章。
關於IBM
IBM 是全球領先的混合雲、人工智慧及企業諮詢服務的提供者,為全球超過175 個國家的客戶服務,協助其從擁有的資料裡獲取商業洞察、簡化業務流程、降低成本,並取得產業競爭優勢。來自金融服務、電信和健康醫療等關鍵基礎設施領域、超過4千家政府和企業機構,採用IBM 混合雲平台和Red Hat OpenShift 解決方案,快速、高效、安全地實現企業數位轉型。IBM 在人工智慧、量子運算、產業專屬的雲端運算解決方案和企業諮詢服務領域的突破性創新,為客戶提供開放和靈活的選擇。IBM 對企業誠信、透明治理、企業社會責任、多元與包容文化和服務精神的承諾,歷久彌新,是IBM 業務發展的基礎。
台灣IBM 公司新聞室:https://taiwan.newsroom.ibm.com/
新聞聯絡
IBM 公司公關部Kate Liu kateliu@cn.ibm.com
[1] 視覺模型(Vision Model) 的基準測試結果可在 IBM技術文章 《IBM Granite 3.2:推理、視覺、預測與更多應用》(2025 年 2 月 26 日發布)中查閱。
[2]指令模型(Instruct Model)的基準測試結果可在IBM 技術文章《IBM Granite 3.2:推理、視覺、預測與更多應用》(2025 年2 月26 日發布)中查閱。
[3]推理擴展(Inference Scaling)的基準測試結果可在IBM技術研究部落格《Granite 3.2 中的推理:利用推理擴展技術》(2025 年2 月26 日發布)中查閱。
[4]推理擴展技術在Granite 3.2 中的應用,IBM 技術研究部落格,2025 年2 月26 日發布

IBM Corporation logo.
最新國際新聞
-
-
16歲少年倚「未成年」槍殺同學!法官引新法當成年人重判 當庭哭到腿軟找媽媽
(7 小時前) -
英:烏克蘭停火提議尚未達成共識 俄國稱西方失去團結
(8 小時前) -
菲律賓將查可疑中國間諜捐獻 確認收受官員身分
(8 小時前) -
Callio Therapeutics 發起 1.87 億美元 A 輪融資,透過臨床概念驗證,讓其多重配置抗體藥物複合體平台再進化
(8 小時前)