2025-02-11 | 中央社
台灣發展AI模型 專家:導入特定領域因應在地需求
各國競相發展大型語言模型(large language model,LLM),台灣「可信任人工智慧對話引擎」(TAIDE)計畫總召集人李育杰今天表示,台灣資源有限,公開服務很燒錢,不容易靠政府推動導入大眾系統,但可以考慮把TAIDE導入華語文教學、法律等特定領域,因應在地需求。
台灣於2023年4月啟動「可信任生成式人工智慧對話引擎」(Trustworthy AI Dialogue Engine, TAIDE)計畫,打造以繁體中文為核心的開源生成式AI模型,力求融入在地特有語言、價值觀、風俗習慣等元素,發展主權AI。
中央通訊社下午舉辦新聞學院講座,主題為「AI趨勢展望:從主權AI到應用落地」,邀請中央研究院資訊科技創新研究中心研究員李育杰、中央研究院資訊科學研究所副研究員黃瀚萱、新創公司仨宇Thuniverse AI執行長蕭景燈等專家,分享相關經驗及看法,中央社董事長李永得、中央社社長胡婉玲也親自出席。
李永得說,了解人工智慧(AI)相關趨勢,能讓中央社有學習和提升的機會。李育杰是機器學習演算法專家,無論國內或國際AI發展都能掌握最新動態。
李育杰提到,中國DeepSeek號稱不到600萬美元(約新台幣1.97億元)可以訓練出一個AI模型,比OpenAI更便宜,不過所有事情都需要代價,DeepSeek運用非常多工程師人力,把所有步驟做到極致,實際付出的人事成本等費用,可能比外界看到的更多。
李育杰說,TAIDE應用,例如檢查文字稿、翻譯或摘要文章,都可以做得很好,另外可以嘗試導入例如華語文教學和法律,針對幾個特定應用,找出相對應的資料進行訓練。
黃瀚萱指出,大型語言模型在推理能力上存在不足,特別是在解決數學和邏輯問題方面,過去的模型主要依賴語感,無法有效解決需要嚴密推理的問題。
黃瀚萱說,Google等科技公司提出的解決方法,是讓模型學會選擇適當的思考框架,從而提高解決問題的能力。OpenAI推出的o1模型在數學、程式設計等需要複雜推理的任務上表現優異,顯著超越GPT-4,接近人類頂尖水準。不過目前模型在跨語言推理上仍有不足,主要訓練資料以英文為主,對中文等其他語言的理解有限。
黃瀚萱表示,中國推出的語言模型例如千問系列,因為高效能和開放性而受到關注,這些模型提供應用程式介面(API)和App,並且有開源做法,讓影響力大增。
他提到,中國AI可以做得這麼強,一點都不意外,中國本來就很會做AI,例如自然語言處理的國際論文約有40%來自中國,已經耕耘非常久,然而使用中國模型可能存在安全風險,特別是在資料傳輸和敏感訊息處理方面。
黃瀚萱說,台灣訓練的大語言模型,目前是有什麼資料就用什麼,而不是根據需求去找資料。數發部正在研擬新的AI資料使用模式,未來放寬限制後,可以考慮加入新聞和影音資料,讓「多模態」能有更好的訓練。
台灣於2023年4月啟動「可信任生成式人工智慧對話引擎」(Trustworthy AI Dialogue Engine, TAIDE)計畫,打造以繁體中文為核心的開源生成式AI模型,力求融入在地特有語言、價值觀、風俗習慣等元素,發展主權AI。
中央通訊社下午舉辦新聞學院講座,主題為「AI趨勢展望:從主權AI到應用落地」,邀請中央研究院資訊科技創新研究中心研究員李育杰、中央研究院資訊科學研究所副研究員黃瀚萱、新創公司仨宇Thuniverse AI執行長蕭景燈等專家,分享相關經驗及看法,中央社董事長李永得、中央社社長胡婉玲也親自出席。
李永得說,了解人工智慧(AI)相關趨勢,能讓中央社有學習和提升的機會。李育杰是機器學習演算法專家,無論國內或國際AI發展都能掌握最新動態。
李育杰提到,中國DeepSeek號稱不到600萬美元(約新台幣1.97億元)可以訓練出一個AI模型,比OpenAI更便宜,不過所有事情都需要代價,DeepSeek運用非常多工程師人力,把所有步驟做到極致,實際付出的人事成本等費用,可能比外界看到的更多。
李育杰說,TAIDE應用,例如檢查文字稿、翻譯或摘要文章,都可以做得很好,另外可以嘗試導入例如華語文教學和法律,針對幾個特定應用,找出相對應的資料進行訓練。
黃瀚萱指出,大型語言模型在推理能力上存在不足,特別是在解決數學和邏輯問題方面,過去的模型主要依賴語感,無法有效解決需要嚴密推理的問題。
黃瀚萱說,Google等科技公司提出的解決方法,是讓模型學會選擇適當的思考框架,從而提高解決問題的能力。OpenAI推出的o1模型在數學、程式設計等需要複雜推理的任務上表現優異,顯著超越GPT-4,接近人類頂尖水準。不過目前模型在跨語言推理上仍有不足,主要訓練資料以英文為主,對中文等其他語言的理解有限。
黃瀚萱表示,中國推出的語言模型例如千問系列,因為高效能和開放性而受到關注,這些模型提供應用程式介面(API)和App,並且有開源做法,讓影響力大增。
他提到,中國AI可以做得這麼強,一點都不意外,中國本來就很會做AI,例如自然語言處理的國際論文約有40%來自中國,已經耕耘非常久,然而使用中國模型可能存在安全風險,特別是在資料傳輸和敏感訊息處理方面。
黃瀚萱說,台灣訓練的大語言模型,目前是有什麼資料就用什麼,而不是根據需求去找資料。數發部正在研擬新的AI資料使用模式,未來放寬限制後,可以考慮加入新聞和影音資料,讓「多模態」能有更好的訓練。
最新生活新聞
-
-
屏東榮服處元宵節前溫馨關懷弱勢榮民眷
(1 小時前) -
嘉義榮服處感謝欣欣水泥企業善心物資 助特需退除役官兵眷
(2 小時前) -
「犁炮」慶元宵 鹽水蜂炮今啟炮為期2天2夜輦轎遶境
(2 小時前) -
2025/02/11 空氣品質說明(22:00)
(2 小時前)