阿里巴巴推出新AI模型「通義千問」參數比DeepSeek更少!但效能差不多?
近期,DeepSeek迅速走紅,甚至並被譽為ChatGPT的有力競爭者,大家開始關注到了中國AI語言模型開發市場,在中國的市場,推出AI模型的新創也在不斷增加,截至2025年3月,中國已有了超過40個大型語言模型,佔全球總數的25%,僅次於美國,同時還有更多大型語言模型正在打磨中,像是由Monica團隊打造的AI助理Manus,還有騰訊開發的元寶。
中國新創打造的語言模型DeepSeek發布以來迅速走紅,在中國本土AI市場的佔有率迅速攀升,甚至有專家覺得可能在未來挑戰ChatGPT的市場主導地位,而除了DeepSeek之外,中國推出AI模型的新創與企業持續增加,截至2025年3月,中國已有超過40個大型語言模型,佔全球總數的25%,僅次於美國,同時還有更多大型語言模型正在打磨,像是由Monica團隊打造的AI助理Manus,還有騰訊開發的元寶。
[caption id="" align="aligncenter" width="1024"]
阿里巴巴旗下的阿里雲於2025年3月推出了「通義千問QwQ-32B」模型,擁有320億個參數,儘管參數數量遠少於DeepSeek-R1,但在數學推理、編碼和問題解決等任務中表現出色,與DeepSeek-R1相當。圖片來源:123RF[/caption]
阿里巴巴旗下的阿里雲於2025年3月6日正式發布並開源了全新的推理模型「通義千問QwQ-32B」模型,擁有320億個參數,參數數量遠少於DeepSeek-R1,但在數學推理、編碼和問題解決等任務中表現出色,號稱在性能上超越了DeepSeek-R1。
DeepSeek是由中國量化基金公司「幻方量化」開發的AI模型,這家公司原本專注於金融數據分析,後來轉向AI技術研發,旗艦模型DeepSeek-R1擁有6.71兆個參數,與OpenAI的GPT-4及Anthropic的Claude 3等主流模型相當,也展示出強大的計算能力與語言理解能力。
而2025年阿里雲推出的「通義千問QwQ-32B」也是一個全新的AI模型,但只有320億個參數,相較於DeepSeek-R1 的6,710億個參數,它的規模小很多,但阿里巴巴強調,這個模型透過技術優化,效能與DeepSeek-R1差不多,甚至在某些測試中還更強,需要處理的數據量較少還可以在較小的裝置或雲端系統上運行,甚至能夠透過「強化學習」技術自主學習,根據環境調整自己的推理方式。
更多新聞:
AI聊天機器人新勢力Manus登場 DeepSeek與ChatGPT還能穩坐龍頭嗎?
騰訊AI聊天機器人「元寶」打敗DeepSeek 奪下載量排行榜冠軍
通義千問特別在哪裡?
阿里雲的這款AI還整合了「AI代理人(AI Agent)」技術,簡單來說,它不只是單純回答問題,還能根據不同的工具和環境,進行更「聰明」的決策,就像一個具備思考能力的AI助理。
阿里巴巴這幾年大力投資AI和雲端技術,這次推出的「通義千問QwQ-32B」,其實是阿里雲從2023年開始推出的一系列AI產品的一部分,他們之前已經開發過Qwen、Qwen1.5、Qwen2、Qwen2.5。
這次的QwQ-32B是最新的版本,而且,他們這次選擇開源,代表不只是阿里巴巴,任何開發者都能下載這款AI模型,並且自行修改、運用在不同的應用中,阿里巴巴還計劃在未來三年內投資3,800億人民幣(約新台幣1.72兆元),穩固阿里雲在AI領域的地位。
可以想見中國AI產業將繼續成長,阿里巴巴與新創DeepSeek、騰訊等中國科技公司之間的競爭,也帶動整個AI產業的發展,這場中國AI大戰,可能才剛剛開始。
這篇文章 阿里巴巴推出新AI模型「通義千問」參數比DeepSeek更少!但效能差不多? 最早出現於 科技島-掌握科技新聞、科技職場最新資訊。
最新科技新聞
-
-
是德科技擴展射頻和微波產品組合 推出全新快速輕巧型測試儀器
(3 小時前) -
大金標準 超越百年 AI智能診斷 會讀空氣的好空調
(3 小時前) -
NVIDIA執行長黃仁勳將於COMPUTEX 2025發表首場主題演講分享最新AI技術進展與突破
(3 小時前) -
漢唐2024年獲利創高每股賺32.94元 擬配息28元
(3 小時前)