今天小編分享的科技經驗:AI視覺領網域明星「Luma AI」完成千萬美元融資,亞馬遜、AMD投了,歡迎閱讀。
文|周鑫雨
編輯|蘇建勳
《智能湧現》獲悉,美國矽谷 AI 視覺領網域企業 "Luma AI" 近日完成新一輪融資,金額為千萬美元。
該輪的投資陣容包括亞馬遜、AMD、Factorial Funds、LDV Capital 四家歐美企業或基金。與此同時,老股東 A16Z、Amplify Partners 和經緯(Matrix Partners)繼續加碼。
據了解,該輪融資主要用于加速視覺人工智能基礎模型和產品的開發。
成立于 2021 年,Luma AI 是一家聚焦于計算機視覺内容的技術型公司,旗下自研模型涵蓋視頻生成、3D 生成和圖片生成。2024 年 1 月,《智能湧現》曾報道了 Luma AI 完成 4300 萬美元 B 輪融資的消息,投資方為 A16Z。
在全球範圍内,AI 賽道的資源分配都已經進入了 " 中場 "。據科技媒體 Techcrunch 的統計,2024 年下半年月均過億融資筆數,比上半年少了 10%。與此同時,熱錢正在集中湧向 AI 應用層,尤其是 AI 搜索、AI 銷售、機器人、AI 編程等領網域。
模型層是基礎設施,AI 模型層不能單獨成為產品,最終流量需要 AI 應用承接——無論是投資者,還是 AI 從業者,目前已經形成了這一共識。
2024 年 11 月 26 日,主要在模型層發力的 Luma AI,也發布了繼視頻生成模型 Dream Machine 出圈後的第一款 AI 應用型產品 Dream Machine AI 創意平台。
" 和 ChatGPT 等語言模型相比,視頻模型還是比較小眾的領網域。"Luma AI 產品設計師 Jiacheng Yang 發現,Dream Machine 的用戶主要是有 AI 或者影視制作經驗的專業人群。他對《智能湧現》解釋了發布主打影像設計的 AI 創意平台的理由:
" 相較于視頻生成,影像領網域的用戶基礎更大,有利于擴大我們的用戶基數。我們的目标就是做一款 AI 小白和設計小白都能輕易上手的 AI 視覺工具。"
Dream Machine AI 創意平台,可以理解為一個集合了文生影像設計、AI 頭腦風暴、主體 / 風格參考、設計圖轉視頻等功能的設計平台。
Dream Machine AI 創意平台的主體 / 風格參考功能。圖源:Luma AI
相較于 Midjourney、Stable Diffusion 等文生圖產品,Dream Machine AI 創意平台對自然語言 Prompt 的理解能力更強,同時還能在圖片中生成更高清和富有設計感的配文。
Dream Machine AI 創意平台生成的高清配文。圖源:Luma AI
Dream Machine AI 創意平台易上手、性能強的原因,仍在于底層的模型能力。目前,平台的語言理解能力,來自 Luma AI 基于第三方語言模型構建的 Agent;圖片生成能力,源于 Luma AI 自研的圖片生成模型 Luma Photon;而圖生視頻能力,則來自 2024 年 6 月 16 日發布的自研視頻生成模型 Dream Machine。
彼時,Sora、生數科技 Vidu 等視頻生成模型只停留于發布 demo 階段,并沒有對外公測。Dream Machine 靠率先 " 免費 "" 公測 ",以及不錯的性能、" 梗圖 " 的玩法,一度在社交平台走紅。
上線 4 天,Dream Machine 的用戶數就突破了 100 萬。與此同時,Luma AI 數據產品負責人 Barkley Dai 告訴《智能湧現》,Dream Machine 的推廣費用為 0。
目前,Luma AI 團隊規模在 50 人左右。據 Barkley 介紹,2023 年 12 月決定啟動視頻生成項目後,團隊規模從 10 人擴展到了 50 人,主要引入了視頻生成領網域的頂尖人才。
高人才密度作戰的效果,體現在了 Dream Machine 的性能上。Dream Machine 目前能夠用 20 秒左右的時間,生成 5 秒視頻。與此同時,極為仿真的攝影機運動軌迹、自然的光影變化,以及豐富的機位,是 Dream Machine 的特點。在 2024 年 9 月發布的 1.6 版本中,用戶只需要輸入文字 Prompt,就能調整相機的移動方向。
與此同時,靠 3D 生成技術起家的 Luma AI 旗下,還有 Text to 3D 工具 Genie。彼時,Genie 是市面上僅有的能在 10 秒内生成 3D 模型的工具。
在商業化層面,一方面,Luma AI 旗下的視頻、影像、3D 領網域的模型產品,對外提供 API;另一方面,Dream Machine AI 創意平台等應用層產品,将采用限免 + 付費訂閱的收費模式。
當下,Luma AI 也成了少有的在視頻、影像、3D 多模态領網域全面布局的 AI 初創企業。在公開訪談中,Luma AI 首席科學家 Jiaming Song 提到,多模态模型訓練所需的 Token 量遠大于語言,多模态的 Scaling Law 能讓模型更好地理解世界。
延伸閱讀:
《叫板 Sora 出圈後,Luma AI 如何接住潑天的流量?|智湧專訪》
歡迎關注!