2024-11-26 | 中央社
輝達新AI模型變聲好神奇 小號吹出狗叫聲
全球人工智慧(AI)晶片霸主輝達(Nvidia)瞄準音樂、電影和電玩遊戲製作人,今天展示一款用於生成音樂和音頻的AI新模型,不僅可用於改造現有音頻,還能自行創造、生成新聲音。
路透社報導,輝達表示,目前並未打算立即公開推出這項Fugatto(Foundational Generative Audio Transformer Opus 1)技術。
Runway等新創公司以及諸如Meta Platforms等更大型企業,都有發表可根據文字提示生成音訊或視訊的技術。
而輝達的版本會根據文字描述生成音效和音樂,包括新奇的聲音,例如小號會發出像狗叫的聲音。
Fugatto與其他AI技術不同的地方,在於它能接收和修改現有音頻,例如將鋼琴彈奏的一段音樂轉換為人聲演唱版本,或讓錄下來的口語改變口音及其情緒表達。
輝達深度學習應用研究副總裁卡坦察羅(Bryan Catanzaro)表示:「想想過去50年的合成音頻,就會發現當下的音樂聽起來不一樣,因為有電腦、合成器。」
「我認為生成式AI將為音樂、電玩和想創作的普通人帶來新的能力。
路透社報導,輝達表示,目前並未打算立即公開推出這項Fugatto(Foundational Generative Audio Transformer Opus 1)技術。
Runway等新創公司以及諸如Meta Platforms等更大型企業,都有發表可根據文字提示生成音訊或視訊的技術。
而輝達的版本會根據文字描述生成音效和音樂,包括新奇的聲音,例如小號會發出像狗叫的聲音。
Fugatto與其他AI技術不同的地方,在於它能接收和修改現有音頻,例如將鋼琴彈奏的一段音樂轉換為人聲演唱版本,或讓錄下來的口語改變口音及其情緒表達。
輝達深度學習應用研究副總裁卡坦察羅(Bryan Catanzaro)表示:「想想過去50年的合成音頻,就會發現當下的音樂聽起來不一樣,因為有電腦、合成器。」
「我認為生成式AI將為音樂、電玩和想創作的普通人帶來新的能力。
最新科技新聞
-
是德科技推出AI資料中心建構工具,以驗證並最佳化網路架構和主機設計
(11 小時前) -
美國中心地區半導體大展 台灣推科技自由全球合作
(13 小時前) -
長期吃素恐得「可逆性失智」 醫曝缺乏維生素B12與記憶力的驚人連結
(17 小時前) -
全球首間以精品級服務為核心的空調品牌概念店!「空氣美學事務所」以尊榮體驗開創新標準
(1 天前) -
輕鬆快速成為職人咖啡師就靠它!iDrip iBarista咖啡大師智慧咖啡機開箱使用分享
(1 天前)