今天小編分享的科技經驗:MiniMax公布首個AI高清視頻生成模型,闫俊傑:做技術其實是一件很“奢侈”的事,歡迎閱讀。
MiniMax 公司創始人、CEO 闫俊傑
繼 Sora、Runway 之後,國内又一款 AI 視頻生成模型來了!
钛媒體 App 獲悉,8 月 31 日舉行的首屆 MiniMax Link 夥伴日上,MiniMax 創始人、CEO 闫俊傑發布 MiniMax 首款 AI 高清視頻生成模型技術:abab-video-1。
據悉,用戶目前可以在海螺 AI 官網免費體驗生成包含文字的視頻,最高支持原生 1280*720 的 25fps,擁有電影感鏡頭移動,被稱為是 AI 視頻界 Ideogram。目前 AI 視頻時長最高 6 秒,未來或支持 10 秒,整個視頻效果不亞于 Sora、Runway 等。
钛媒體 AGI 做了相關測試。比如下面這段視頻,體現的是一座山上的一塊石頭破碎,從裡面蹦出一個 " 馬斯克 "。
再比如下面生成對比 Sora 演示場景,一位時尚女性走在東京的街道上,街道上到處都是溫暖的霓虹燈和動畫城市标識。她穿着黑色皮夾克、紅色長裙和黑色靴子,手拿黑色手提包。她戴着太陽鏡,塗着紅色口紅。她自信而随意地走着。街道潮溼而反光,五顏六色的燈光營造出鏡面效果。許多行人走來走去。
雖然背景和顏色有所區别,但相比 Sora,MiniMax AI 視頻生成的效果也非常真實和生動。
闫俊傑在演講中透露,截至目前,MiniMax 每天可以給全球用戶提供超 30 億次互動,每天處理超 3 萬億 Token(行業内最高)——等價于一天看完 7000 本書、或 2000 萬張圖片、或 7 萬小時的語音。同時,當前 MiniMax 單日總互動時長與 ChatGPT 的百分比為 53%,差距在不斷減小。
會後,針對與大廠之間的競争,闫俊傑對钛媒體 App 等表示,這本質上是一件好事,比如電動車、手機、移動互聯網都經過了長期激烈的競争,最終使得中國產品需求特别強,它既可以產生很大的社會價值,而且确實應該有很多競争,這是一個客觀規律。MiniMax 需要做好亮點,第一點的話技術如何提升,第二是如何跟用戶做更好的共創。
" 我們作為一家小的創業公司來說,其實就是說如果比如說我們在競争中打不赢,我們就應該被淘汰,其實我們也沒有其他的選擇。" 闫俊傑表示,現在公司規模還很小,還需要足夠長的時間發展,希望外界能夠給予更多耐心。
闫俊傑強調,技術研發其實是一件很 " 奢侈 " 的事情,這件事甚至只有創業的時候才會理解。因為技術可能會失敗,技術具有不可預測性,而且技術研發投入很大。然而,AGI 本身很難走 " 捷徑 ",而且一旦技術被突破之後,就能非常顯著感受到用戶、客戶對你的認可。因此,企業的正向發展依然需要持續技術投入和進步。
實際上,在闫俊傑看來,算法一樣的情況下,擁有更多的數據訓練就意味着更好的模型效果。因此,在兩個性能類似的模型中,更快的模型一定是更容易受益到數據的增長,從而能夠有一個更好的模型能力。這就是在同樣的能力範圍下," 快就是好 "。
闫俊傑在與钛媒體 App 等對話中進一步解釋稱,不管是做 MoE 還是其他有價值的技術探索,本質上,公司技術研發還是希望讓同樣的效果模型變得更快。快就是好,意味着同樣的算力可以變得更好,這個是其打底層研發的思路。
未來,如何讓企業持續發展是公司的重要核心之一。闫俊傑指出,行業需要持續解決 AI 模型三個挑戰:錯誤率持續降低、無限長輸和輸出、多模态。
闫俊傑認為,MiniMax 產品并非僅技術新品,它的底層設計也不是陪伴用戶聊天。實際上,MiniMax 希望構建的是一個 " 内容社區 ",裡面可以補充一些角色。
" 包括現在我們提供了更多樣的工具中可以在裡面創建故事、創作世界觀,來進行互動,它其實類似于小說、賬戶體驗,它的核心其實是一個内容社區,而不是說它的核心是說每個人來聊天,這是不一樣的。" 闫俊傑對钛媒體 App 表示。
談及最新視頻生成的技術優勢和落地,闫俊傑坦言,相比可靈,MiniMax 視頻技術推出的确實要晚一、兩個月,核心在于團隊在解決 " 如何能夠原生算法訓練成本比較高的東西 " 這個技術問題,因為視頻 Token 越長,復雜度越高,而 MiniMax 希望通過研發新的算法把復雜度降低,壓縮率變高,将最終算法效果提升數倍。
" 今天只是我們第一個版本,我們應該還會更新,策略是可能會先在每一兩周出現新的東西、更加滿意狀态後,再考慮一些商業化,包括開放平台、廣告變現等方式。但目前這個階段,最重要的可能還不是產業化,而是真正實現對技術能夠達到廣泛可用的程度。" 闫俊傑表示,後續會在數據、算法本身進行更新迭代,比如現在只提供了文生視頻,未來或将提供圖生視頻、文 + 圖生成視頻、可編輯、可控性增強等。
關于 To B 領網域,闫俊傑在演講中透露,截至目前,MiniMax 開放平台已經擁有超過 3 萬名開發者,且仍在持續、快速增⻓。
談及大模型 " 價格 " 競争,闫俊傑指出,當國内大模型 " 價格戰 " 發生後,大部分公司本認為大模型很貴,之後很多人認為大模型很便宜,可以放心地使用。最終非常驚人地發現,有許多傳統企業非常願意使用大模型,他們覺得反正成本低,出錯了之後也不要緊,多調用一次就好了。客觀地來說,這極大提高了模型調用量,從而推動模型做的更好,至少目前在非英語語種上,國内大模型水平已與 GPT 不相上下。因此,樂觀角度看,國内大模型的使用量确實在顯著地增長,并且中國 AI 大模型在海外确實越來越具有競争力。
" 競争不可避免,既然不能避免,就要努力做到最好。" 闫俊傑稱。" 在同等計算 GPU 條件下,盡可能訓練更多的輪次、更大數據,做一些科研上的比較有挑戰的事,做别人沒有做過的事情。經過幾次科研的突破,其實能以比較有限的資源,做出一個在國際上第一梯隊多模态的表現,這個我們目前還是比較驕傲的。"
闫俊傑強調,"(行業)真正需要的是,一家至少像我們這樣的創業公司,真正應該花錢做的研發,是那種能夠帶來幾倍變化的技術。這種東西很多時候如果我們自己不做,外面也沒有,用戶需求多、技術還非常重要,我認為這才是比較核心的。不管是現在,還是再往後看,我們在什麼樣的技術方向上最願意花錢,核心的判斷是,我們認為這個方向做出來能不能帶來幾倍的變化,如果能的話,不管多難都要做出來。如果不滿足這個标準,不管多簡單我們都不應該做。"
關于國内外 AI 商業化的異同話題,MiniMax 國際業務總經理盛靜遠對钛媒體 App 表示,不同行業有其底層規律,To B 行業需要有規模的商業化。在國内,To B 業務多成項目制,大模型純技術輸出定制的商業模式難以持續實現 ROI,因此需要思考把偏工具類 AI 產品形成有用戶粘性并且增強技術能力與產品特色。海外市場則有所不同,MiniMax 產品能力處于國際第一梯隊,所以只需将其產品不斷打磨,通過 API、訂閱等模式在海外用戶付費習慣好的情況下進行推廣,海外市場打法相對直接,變現也更快。而 MiniMax 現在技術已處于領先,更多是公司經歷、資源和變現問題。
"ROI 是會有轉起來的一天,但不是今天的商業形态。" 盛靜遠稱,MiniMax 還是希望在有限的資源内,做到核心技術不斷突破,從而讓產品最終實現商業化,來反哺後續技術投入——這才是公司發展成功、實現正向循環的标志。
談及與大公司(投資方)在市場競争中的關系,闫俊傑指出,投資者是一個組織,一個組織意味着大部分時候沒有一個統一的觀點。目前,MiniMax 還是一家很小規模的公司,相比大互聯網公司非常成熟的業務來說,占比都是非常小的,甚至可以說不值一提。
闫俊傑強調,對于 MiniMax 來說,核心還是把自身技術能力做到更好。
"MiniMax 作為一家有理想主義且腳踏實地的公司,今天的核心產品和技術進展還是遠遠不夠的,我們仍然在努⼒前⾏。但我們很幸運的是,有在座的合作夥伴以及全球各地⽇益增⻓的⽤戶們的支持,未來和 MiniMax ⼀起攜⼿努⼒,把⼈類的智能邊界再向外推動⼀點,真正實現 Intelligence with Everyone(與每個人共創智能)。" 闫俊傑在演講結尾表示。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)