OpenAI首席技術官:Sora或將在今年向大眾推出,增加生成音頻
OpenAI首席技術官米拉·穆拉蒂(Mira Murati)在接受采訪時透露,Sora文生視頻工具計劃在今年內正式推向公眾。此外,OpenAI還計劃為Sora加入音頻生成功能,進一步豐富視頻的場景和情感表達。
目前,Sora模型已經具備輸出60秒視頻的能力,其中包含了高度細致的背景、復雜的多角度鏡頭以及富有感情的人物、動物角色,自推出以來引起了業(yè)界和消費者的廣泛關注,但Sora目前只向測試團隊和一部分視覺藝術家、設計師和電影制作人開放, 普通人難以體驗Sora文生視頻的魅力。
穆拉蒂透露,目前利用Sora生成視頻的成本過高,這是Sora難以普及的一個重要原因,團隊正在優(yōu)化相關技術,促進Sora造福更多人。她還表示,OpenAI計劃加入音頻功能,并允許用戶編輯Sora生成的視頻內容,以此來使其生成的視頻更符合要求。
Sora的研究表明,通過擴展視頻生成模型是構建物理世界通用模擬器的一條極具前景的途徑,對此360創(chuàng)始人周鴻祎曾如此評價:“一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對世界的理解將遠遠超過文字學習,一幅圖勝過千言萬語,這就離AGI(通用人工智能)真的就不遠了,不是10年20年的問題,可能一兩年很快就可以實現(xiàn)!
隨著Sora技術的不斷進步和成本的降低,我們有理由相信,不久的將來,這項創(chuàng)新的視頻生成工具將不再是少數(shù)人的專屬,而是成為大眾創(chuàng)作的新寵。至于Sora的公開是否會促進通用人工智能的發(fā)展,相信我們很快就可以看到答案。
原文標題 : OpenAI首席技術官:Sora或將在今年向大眾推出,增加生成音頻

請輸入評論內容...
請輸入評論/評論長度6~500個字