臺北市
21°
( 24° / 19° )
氣象
2019-11-29 | 客家電視

本土語料庫首創 「客語語料庫」擬3年後上線

【錢薇如 黃映婕 台北】

面對數位新時代,客語也要與時俱進,客委會從106年開始建構,台灣客語語料庫系統,建立台灣第一個本土語言語料庫,目前已有階段性成果,預計在111年底上線,將這些珍貴的語料保存,未來能在教育,研究跟翻譯上有更多的應用。

客語語料數位化已經成為進行式,客委會建立了耗資6千多萬的客語語料庫系統,以客語文本以及客語口語內容,作為主要的語料來源,客委會主委李永得也強調語言是文化根本,因此將客語語料數位化,有其必要性。

客委會主委 李永得:「透過我們的數位化,來做一個保存,最重要是可以將來,包括語言的學習,推廣啊,保存、研究,可以做很大的貢獻。」

台灣客語語料庫蒐集了,電視節目、訪談內容、出版品及文章等,各種形式的客語文本。而目前客語語料庫的階段蒐集進度,書面語料已有500萬字、口語語料10萬字、書面授權出版品有316筆,單篇文章也有149筆。

政大傳播學院副院長 劉慧雯:「我們過去知道說,書寫或者是文字都散落在民間,那目前是有一個比較中心的單位,來負責蒐集保存,那在應用上,有可能是出現對譯,比方說跟華語對譯,跟英文對譯,或者是說應用在長照上面,如果老人家不會說,其它的語言的話,客語這個部分可以協助幫忙。」

將珍貴的客語語料保存,可以應用在學術研究,教學、翻譯、語音辨識,在未來也有機會,透過語料庫的系統,發展成長照服務的AI系統,同時也能永續保存,客語及客家文化的樣貌。

最新生活新聞

延伸閱讀