臺北市
16°
( 18° / 13° )
氣象
快訊

2019-12-04 | 科技新報

LINE 努力訓練 AI 聽說能力,要成為 LINE Bank 等服務重要的技術支架

LINE 努力訓練 AI 聽說能力,要成為 LINE Bank 等服務重要的技術支架

語言助理是這年代熱門話題,但不是每家企業有工程團隊能寫程式串接 Chatbot,提供語音問答服務。因此提供工具協助一般企業建議 Chatbot 是 AI 應用普及的重要一步。台灣人常用的 LINE 通訊與網路入口服務佈局未來,推出 Chatbot Builder Framework,能不用寫程式只要餵資料,就能建構 Chatbot,服務不同應用場景。
LINE 努力訓練 AI 聽說能力,要成為 LINE Bank 等服務重要的技術支架

NAVER Clova 資料科學家李在元負責帶領 Chatbot Builder Framework,解釋他們推出 LINE Partners 計畫要積極招商,尋求不同領域的公司來合作,建構 Chatbot 生態。而台灣不少人很關心 Clova 的中文語音辨識的狀況,李在元指出他們拿韓語的訓練資料集 chitchat 來訓練,並且將 Chitchat 資料集翻譯成英文和台灣中文,訓練英文和台灣中文的問答。結果發現中文情境下,測試的次數越多,辨識的成功率下降。要能推出台灣人滿意而且辨識率達一定程度,還需要努力。

另外 Chitchat 資料集翻譯成英文、台灣中文,也會發生中文有的句型,並不會存在翻譯過來的 Chitchat 資料集當中,造成 Chitchat 訓練出來的中文語音辨識會缺句型,需要另外補上缺漏的句型資料來訓練。

▲ 李在元解釋中文辨識度的問題 ,希望能隨著時間能夠逐步改善。(Source:科技新報)

李在元指出他們總共用四種模型訓練出適合的語音辨識模型,並且透過 AutoML 模型再選擇最適合,辨識度最高的模型,來服務使用者。

LINE 推 LINE Partners 語音服務計畫,至於 Chatbot Builder Framework 的收費模式,李在元指出要依案例來談,有很多種雙方都能獲益,資源交換的型式,客戶資料如金融業狀況,不能隨便上雲端,也能用 on-premise 的型式安裝在合作客戶的機器。

李在元指出,目前語音辨識模型在多語言混雜情境當中,因為模型針對單一語言訓練,隨著混雜的語言比重越高效果不好,像是 90% 英語搭配 10% 中文,相比 80% 英文搭配 20% 中文,後者辨識效果會比較差。不過搭配 superdomain 模型,判斷講者主要是講什麼語言,再搭配特定語言的模型,能達到比較好的語音辨識效果。

LINE 由於有即時通訊軟體的優勢,可以運用 LINE ID 提供的身份認證機制,對於語音辨識衍生的應用,來說,能夠方便的口語介面。像是 LINE 提出的 LINE Brain 與之後要上線的 LINE Bank,語音辨識與語音服務是他們各自業務重要的核心,LINE 與他們母集團 NAVER 必須要做出辨識正確率高的語音辨識程度,才能達成這兩項計畫給予技術支援,滿足使用者的期待。

(首圖來源:科技新報)

最新科技新聞

延伸閱讀