臺北市
26°
( 27° / 23° )
氣象
2024-12-02 | 草根影響力新視野

如何辨識機器與人類的聲音?

如何辨識機器與人類的聲音?


草根影響力新視野(琪拉編譯)


我們生活已經與人工智慧密不可分,我們可以隨時與人工智慧進行對話,向聊天機器人提出問題,他們甚至會提供引人入勝的口頭答案,您也可以使用多種語言與他們聊天,並請求以特定的方言或口音回覆。


人工智慧甚至可以複製真人的聲音。最近,其中一個被用來複製已故英國廣播員邁克爾·帕金森爵士的聲音,以製作一個由八部分組成的節目。


這些技術甚至被用於複雜的騙局中,誘騙人們將錢交給犯罪分子。但並非所有人工智慧生成的聲音都被用於邪惡手段。它們也被內建到由大型語言模型支援的聊天機器人中,以便它們能夠以更自然和令人信服的方式進行回應和交談。


這些功能提出了一個有趣的問題:人類聲音是否有任何獨特之處可以幫助我們將其與機器人語音區分開來?


喬納森·哈林頓 (Jonathan Harrington) 是德國慕尼黑大學語音學和數位語音處理教授,他花了數十年時間研究人類說話、發音和口音的複雜性。就連他也對人工智慧語音合成器的功能印象深刻。「在過去 50 年裡,尤其是最近,語音生成已經變得如此出色,以至於通常很難區分人工智慧生成的聲音和真實的聲音。」他說。





圖片取自:(示意圖123rf)

科學家曾經做過實驗,令人驚訝的發現,大約有一半的人無法透過耳朵辨別真人或人工智慧的聲音。因為若人僅透過朵聆聽,很難辨別哪個聲音是人類的,哪個是人工智能的。


但專家認為仍然有一些重要的線索可以幫助我們判斷我們是在與人類還是人工智慧交談。


目前專家已經在研究深偽檢測軟體正在幫助捕捉人耳可能錯過的東西。對於人耳來說,人工智慧的聲音跟人類真實的聲音沒兩樣,但透過詐騙分類器運行它,它被標記為深度偽造。


另外,不自然的語音模式可能也是人工智慧的聲音。例如不規則的停頓和尷尬的措辭,扭曲和不匹配的背景噪音等奇怪的偽影也可能會露出馬腳。


聽句子中的重音或強調詞可能是識別電腦生成語音的好技巧。像是『瑪麗安娜做了果醬』這樣的句子,如果作為一個沒有上下文的單獨句子來閱讀,通常最強調第一個和最後一個單詞。但如果有人問瑪麗安娜是否買了果醬,重點可能會落在答案中的“製造”一詞上。


如果您懷疑正在交談的聲音可能不是人類,則可以嘗試其他一些技巧。例如,你可以命令它尖叫。因為許多人工智慧語音系統很難在正常音域之外說話,除非經過專門訓練。


格倫南說,人類語言的缺陷可能是另一個洩漏的訊息。糾正自己、重新思考自己的想法,是一件非常人性化的事情。 您不太可能聽到 ChatGPT 說:“呃沒關係!”或“你知道嗎!?”


但在人工智慧生成和人工智慧偵測之間不可避免的軍備競賽中,我們可能會在日益虛擬互聯的世界中失去實體互動。因此,當你在尋找是否在與人交談時,解決方案很簡單,那就是花更多時間面對面交流。


資料來源:https://www.bbc.com/future/article/


[不許轉載、公開播送或公開傳輸]

Google新聞-PChome Online新聞

最新科技新聞

延伸閱讀