臺北市
25°
( 29° / 18° )
氣象
2019-11-29 | 教育廣播電台

「臺灣客語語料庫」數位化建置 機器人也可說客語

「臺灣客語語料庫」數位化建置 機器人也可說客語

為了保存客家語言,客委會積極建置「臺灣客語語料庫」,完整蒐集珍貴的客家文字、聲音,進行數位化,未來將做為學術研究、客語學習之用,甚至應用在人工智慧,與長照機器人對話。

客家委員會主委李永得表示,客語過去只有口語對話,沒有文字,若不好好整理,會隨著語言的使用,及不斷與外來語混用,而逐漸變化與消失,因此,客委會希望用現代科技,進行保存與轉譯,未來能利用AI,與其他語言同步對譯,更希望導入手機的語音秘書,可隨時多語對話。

「臺灣客語語料庫」目前已經蒐集書面語語料500萬字、口語語料10萬字,計畫共同主持人政治大學傳播學院副院長劉慧雯指出,客語語料庫是目前最完整、最大量蒐集客語聲音與文字語料的資料庫,並透過完整系統架構儲存,所以未來在AI應用上可能性非常大,而除了學術、教學之外,在長照機器人的使用上,都非常有潛力。

配合「國家語言發展法」上路,未來將建置國家語言資料庫,客委會表示,「臺灣客語語料庫」將在民國111年上線, 屆時將提供外界使用,有利於未來產製客語的各項加值服務。

最新生活新聞

延伸閱讀