无码人妻一区二区三区av,小荡货奶真大水真多紧视频,亚洲av乱码一区二区三区按摩

英偉達(dá)發(fā)布全新 AI 音頻模型 Fugatto

2024-11-26 11:21

編譯/前方智能

英偉達(dá)近日推出了一款名為 Fugatto（全稱為 Foundational Generative Audio Transformer Opus 1）的 AI 音頻模型。這款模型不僅能通過文字提示生成音樂和音效，還能對現(xiàn)有音頻進(jìn)行修改和轉(zhuǎn)換，創(chuàng)造出前所未有的聲音組合。

圖源：英偉達(dá)

據(jù)英偉達(dá)介紹，F(xiàn)ugatto 具備多項獨特功能，比如可以將鋼琴演奏的音樂轉(zhuǎn)換為人聲演唱，能夠調(diào)整語音的口音和情緒，甚至可以創(chuàng)造出"尖叫的薩克斯"或"犬吠般的小號聲"等超現(xiàn)實音效。該模型采用了創(chuàng)新的 ComposableART 技術(shù)，能夠?qū)⒂?xùn)練過程中分別出現(xiàn)的音頻特征進(jìn)行組合，從而產(chǎn)生全新的聲音效果。

在技術(shù)層面，研究團(tuán)隊使用了來自全球多個開源數(shù)據(jù)集的約 2000 萬個音頻樣本進(jìn)行訓(xùn)練，形成了一個擁有 25 億參數(shù)的大規(guī)模模型。該項目由來自印度、巴西、中國、約旦和韓國等多個國家的研究人員共同開發(fā)，這種多元化的團(tuán)隊構(gòu)成也使得模型在處理多語言和多重口音方面表現(xiàn)出色。

英偉達(dá)應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示，生成式 AI 技術(shù)將為音樂、游戲和普通創(chuàng)作者帶來全新的創(chuàng)作可能性。不過，考慮到生成式技術(shù)可能帶來的潛在風(fēng)險，英偉達(dá)目前尚未計劃對外發(fā)布這項技術(shù)。

原文標(biāo)題 : 英偉達(dá)發(fā)布全新 AI 音頻模型 Fugatto