今天小編分享的科技經驗:騰訊混元技術負責人劉威離職創業,又一巨頭暫緩Sora的故事,歡迎閲讀。
文|周鑫雨
編輯|蘇建勳
《智能湧現》從多名獨立信源處獲悉,原騰訊 AI Lab 計算機視覺中心負責人、混元大模型技術負責人之一劉威于近日離職。
此外,AI Lab 計算機視覺中心暫時由 AI Lab 副主任俞棟管理。
對上述信息,截至發稿前,騰訊官方暫無回應。
多名從業者對《智能湧現》表示,劉威已經在新加坡創業,瞄準的還是視頻生成領網域。
原騰訊 AI Lab 計算機視覺中心負責人、混元大模型技術負責人劉威。圖源:騰訊 AI 實驗室微信公眾号
在騰訊,具有 " 傑出科學家頭銜 " 的劉威,最為人所知的身份是騰訊混元大模型的技術負責人之一。
此前,他曾任騰訊廣告多媒體 AI 中心總監,帶領團隊基于混元大模型,研發了廣告多媒體 AI 技術矩陣,提高了騰訊的廣告轉化效果和廣告制作效率。
種種迹象表明,在驗證落地場景和商業模式前,騰訊對視頻生成的投入還十分謹慎。
一名從業者表示,影像、音頻是目前騰訊多模态研究的重點:" 技術成熟,成本可控,而且比較容易找場景。" 比如,2024 年 11 月,微信公眾号最新版本上線了 " 朗讀音色 " 功能,用 AI 實現了音色克隆。
" 在騰訊,目前 CV 研究的主力在混元團隊。但總體而言,騰訊對視頻生成的人力和資源投入還不是很大。" 上述從業者表示。
另有相關人士表示,騰訊 AI Lab 計算機視覺中心所配備的人力向來很少,劉威創業後又帶走了多名成員," 總體而言,AI Lab 對視頻生成很佛 "。
有關是否大力投入視頻生成模型,如今中國互聯網公司已經抽成了泾渭分明的兩派:
大舉投入派,以字節跳動和快手為代表。2024 年 6 月,快手發布了效果轟動一時的 " 可靈 AI";同年 9 月,不甘人後的字節一口氣發了兩款視頻生成模型:Seaweed 和 PixelDance。
這些公司的特點在于,具有豐富的視頻數據資源,以及能立刻與視頻生成技術相結合業務場景。
而另一暫緩投入派,如百度,則對目前視頻模型的商業回報,持有較為消極的态度。
此前《智能湧現》曾獨家報道,在 2024 年 Q3 總監會上,百度董事長兼 CEO 李彥宏明确表示,Sora 這種視頻生成的投入周期太長了,10 年、20 年都可能拿不到業務收益,那麼無論多麼火爆,百度都不去做。
而騰訊對視頻生成模型的态度天平,也正在向保守和觀望傾斜。在明确落地場景和商業化回報之前," 類 Sora" 的視頻生成模型還不會成為騰訊挺進的領網域。
歡迎交流!