今天小編分享的财經經驗:OpenAI首席技術官最新透露:Sora預計将在今年發布,計劃加入語音功能,還有這些“幹貨”,歡迎閱讀。
OpenAI 似乎已經在為 Sora 降世預熱了。
當地時間 3 月 13 日周三,OpenAI 首席技術官米拉 · 穆拉蒂(Mira Murati)接受了《華盛頓郵報》的視頻專訪。
穆拉蒂在接受采訪時透露,目前利用 Sora 生成視頻的成本非常高,團隊正在優化技術,預計将在今年正式發布。
穆拉蒂透露,OpenAI 人工智能文生視頻大模型 Sora 即将于今年晚些時候正式向公眾發布,OpenAI 計劃最終加入音頻功能,以使場景更為真實,同時還将允許用戶編輯 Sora 生成的視頻内容。
除此之外,穆拉蒂還回答了 Sora 的特别之處、如何修正瑕疵、是否會包含音頻、訓練數據來自哪裡等若幹問題。給出的答案有的籠統,有的不乏誠意。
Sora 如何 " 化文字為神奇 "?請你想象一幕場景:" 一條美人魚和她的螃蟹夥伴,正在一起浏覽智能手機…… "
作為這場媒體采訪的 " 福利 ",主持人獲得了讓 Sora 将其提供的多組文本提示,轉化為視頻影像的機會,而以上的這一幕,便是 Sora 提供的視頻中的一幀。
圖片來源:視頻截圖
Sora 究竟是如何實現這一轉換的呢?穆拉蒂表示,盡管解釋美人魚的進化可能都要比解釋 " 擴散模型 " ( diffusion models ) 的内部運作容易得多,但簡而言之便是:人工智能模型分析了大量視頻,學會了識别物體和動作。然後,當你給它一個文字提示時,它就會勾勒出整個場景,然後填充每一幀。
在被問及 OpenAI 為 Sora 使用了哪些訓練數據時,穆拉蒂指出,"我們使用了公開數據和授權數據"。
在另外一段視頻裡,主持人要求 Sora 制作一段她更為符合這場采訪的内容:" 兩位 30 多歲、有着棕色頭發的職業女性,在一個光線充足的演播室裡坐下來接受新聞采訪。"
圖片來源:視頻截圖
最終,在 Sora 交出的 " 作業 " 裡,無論是兩位女性嘴型和頭發的動捕,還是皮夾克上的細節,一切看起來都那麼真實。Murati 指出,這段 20 秒的 720p 分辨率短片,Sora 花了幾分鍾才制作完成,但目前還未能支持配備音效。
但穆拉蒂已承諾,他們計劃最終會添加聲音。
Murati 還表示,當前 Sora 生成視頻的成本遠高于該公司的影像生成器 Dall-E。不過,在未來向公眾正式發布時,OpenAI 将進行優化,以降低對算力的需求。
北京時間 2 月 16 日,OpenAI 發布文生視頻模型 Sora,效果驚豔,引爆全球。此時距離 OpenAI 推出 ChatGPT,開啟生成式 AI 時代,僅僅過去了 14 個月時間,AI 的進化速度令人震驚。
在 Sora 生成的視頻裡,女士身着黑色皮衣、紅色裙子在霓虹街頭行走,不僅主體連貫穩定,還有多鏡頭,包括從大街景慢慢切入到對女士的臉部表情的特寫,以及潮溼的街道地面反射霓虹燈的光影效果。
Sora 的研究結果表明,擴展視頻生成模型是構建物理世界通用模拟器一條極具前景的途徑,它使人工智能理解和模拟運動中的物理世界邁向了一個新的高度。
有業内人士預言,通用人工智能(AGI)将比預期更早到來,產業差距将拉大。此外,文生視頻所帶來的颠覆性影響引發了人們的擔憂,亦有遠慮者就真實與虛拟間模糊的邊界反復預警。但少有争議的一點是,Sora 被認為有望推動 AI 應用加速落地。
與此同時,Sora 的誕生引發了人們對于 AI 未來發展的更多展望。随着技術的不斷進步,AI 将在更多領網域發揮更大的作用。無論是工業生產、教育培訓還是娛樂休閒等領網域,AI 都将為人類帶來更多的驚喜和可能性。
2 月 16 日,360 創始人周鴻祎發布微博提到自己對 Sora 的看法,周鴻祎認為,Sora 的誕生意味着 AGI(通用人工智能)實現可能從 10 年縮短至一兩年。
談到 Sora 最大的優勢,周鴻祎表示,以往文生視頻軟體都是在 2D 平面上對圖形元素進行操作,可以把視頻看成是多個真實圖片的組合,并沒有真正掌握這個世界的知識。但 Sora 產生的視頻裡,它能像人一樣理解坦克是有巨大衝擊力的,坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的情況," 這次 OpenAI 利用它的大語言模型優勢,讓 Sora 實現了對現實世界的理解和對世界的模拟兩層能力,這樣產生的視頻才是真實的,才能跳出 2D 的範圍模拟真實的物理世界。"
周鴻祎提到,有了大模型技術作為基礎,再加上人類知識的引導,可以創造各個領網域的超級工具,例如在生物醫學、蛋白質、基因研究,包括物理、化學、數學的學科研究上,大模型都會發揮作用。
" 一旦人工智能接上攝像頭,把所有的電影都看一遍,把 YouTube 上和 TikTok 的視頻都看一遍,對世界的理解将遠遠超過文字學習,一幅圖勝過千言萬語,這就離 AGI 真的就不遠了,不是 10 年 20 年的問題,可能一兩年很快就可以實現。" 周鴻祎感慨。
每日經濟新聞綜合 OpenAI 官網、每日經濟新聞、公開資料
每日經濟新聞