今天小編分享的互聯網經驗:拿到數億融資後,梅濤想說說這代AI創業者的創業解法,歡迎閱讀。
「暗湧 Waves」獨家獲悉,AI 視頻生成初創公司智象未來,繼完成敦鴻資本領投的 Pre-A 輪融資後,又新獲以合肥產投為主的國資基金領投的 A 輪融資,融資規模共計數億人民币。同時參與投資的還包括安徽省人工智能母基金和湖北省長江電影集團有限公司等機構,此前曾獲阿爾法公社與訊飛兩輪領投。
智象未來是全球第一家上線文生視頻的 AI 公司。創業之初,創始人兼 CEO 梅濤就精心算了一筆賬:從對算力和資源的依賴看,相比大語言模型,多模态模型是一種絕對的降維;而從商業化的可能來看,它又可以走的更早、更快。這看似是一種更理性、務實的浪漫,但現實顯然比想象的要更為冷酷。
從年初的 Sora、年中的可靈、再到 Google Veo 2,2024 年的視頻生成早已是兵家必争、且其狂熱絲毫不亞于大語言模型的賽道。
即便如此,創業仍是梅濤這代 AI 研究者很難拒絕的一種誘惑—— AI 從未如此接近商業和現實。
作為中國科學技術大學畢業生,在微軟的 12 年,梅濤登頂過學術的高峰:在多媒體分析和計算機視覺領網域發表論文 300 多篇,先後 15 次榮獲最佳國際論文獎。他不僅成為 IEEE Fellow 和加拿大工程院外籍院士,也是科技部科技創新 2030 人工智能重大項目首席科學家。
這段經歷,也讓他看到從技術到產品的鴻溝,并最終決定要把這個鏈條打通。2018 年之後在京東的五年,是梅濤步入工業界的開始。作為京東副總裁和京東探索研究院副院長,他開始了技術到商業化的探索之路。之後,他創立的智象未來,則是更密切地将這一切串在了一起。
梅濤的創業境遇,很像這個時代 AI 創業者的一個切片:擁抱產品時,不能放棄模型,否則很可能被吞噬;試水國内市場時,又不能放棄出海,因為國内消費市場有很多創業公司無法撬動的困局。至于融資,在當前的資本冷周期中,往往意味着,創業者還要把信心反哺給投資人。
這些也讓梅濤意識到,在大公司做高管和自己下場創業的真正差異——前者是你的身後,始終還有别人;而現在 " 你後面沒有人了 "," 所有問題都會到你這裡來,而你必須要把它們都處理掉。"
以下是創業一年多,梅濤關于融資、商業化等方面的一些心得總結:
視頻生成賽道的确離商業化更近
1. 前段時間,Sora 正式發布,但整體功能跟我們的預期差不多。客觀來看,在當前的視頻生成領網域,OpenAI 已不再具備太大優勢。剛出來時,它雖然只是個 Demo,卻讓整個方法論都發生了改變;但時至今日,從產品落地角度來看,無論是海外還是國内的其他產品,其實都已經相差無幾。
2. 今年開始,視頻生成整個賽道變得很擁擠。6 月份,可靈和 Luma AI 上線,我們在 7 月的上海世界人工智能大會上也官宣了新模型上線。8 月是 MiniMax 海螺、最近是 World Labs 和 Google Veo 2,它們甚至已經從圖片處理過渡到 3D 領網域。競争的熾熱,來自這個賽道更短的商業化路徑,和相比于大語言模型更快的產品落地速度。
3. 去年全球 AIGC 的真正收入大概有 200 億美金,其中 50~60% 的收入來自視頻和影像生成,或者是跟影像視頻相關的工具性收入;30% 是跟大語言模型相關的,比如 chatbot 類的收入。所以很多公司開始往這個賽道轉,它已經成為大模型公司的必争之地。
4. 對于初創公司來說,我們不會跟 OpenAI、字節這些大廠正面競争,我們一是要在算法上有獨辟蹊徑的創新,二是要把細分行業的最後一公裡問題解決好,用產品和閉環價值占領用戶的心智。大廠有算力,特别是 C 端流量的優勢,但他們要為财務報表負責,所以一定會緊盯主流賽道的業務,產品也必須服務好現在的主流產品,像字節的即夢也好,快手的可靈也好,都要服務好他們現有的創作者生态。
5. 我們絕不會在大廠的路徑上去做重復的事,而是有自己專業的、細分的領網域。之前我們做的是 1+3+N,指的是一個大模型、三個核心產品加很多場景生态。之後我們會發布一個新的、對标 GPT-4o 的多模态理解模型,将這個 "1" 做厚做寬。
6. 模型方面,我們自主研發了對标 OpenAI Sora 的全球首個商用百億級參數的視頻生成大模型。我們有國内最全的多模态版權語料、數十萬小時版權視頻素材以及上萬個授權 IP。不僅涵蓋了國内 70% 影視數據,且已形成上億條 AIGC 二創素材,目前在影視、文旅、營銷等場景得到廣泛應用。截至 11 月底,累計服務 100 多個國家和地區的 1000 多萬用戶和 4 萬多家企業,月度經常性收入也實現了規模性增長。
7. 同時,我們即将發布一個 MoE 架構的混合專家新模型。訓練時,它不只有 DiT(Diffusion Transformer 架構,也有 AR(Auto-Regressive)架構,而且能集合兩者優勢,既把 DiT 架構的視覺生成效果體現出來,又能把 AR 架構中 Token 的離散化問題解決。目前我們已在影像上得到驗證。
從模型整體來看,我們先做了生成,又做了理解。未來我們會有一個大一統的模型架構,把理解模型和生成模型融合為一個統一的架構,目前還在實驗階段。再往後,我們也希望能把我們積累的國内最全的版權視頻素材做成 AI 視頻搜索服務。
8. 除大廠外,轉到這個賽道的底座大模型公司也有其獨特優勢,比如它們有萬卡集群的架構經驗。但從對視頻生成的技術路線和對數據的理解來說,我們這些多模态原生的創業公司,要更垂、更專。
另外視頻生成領網域的市場很大,有的公司動畫風格做的好,有的公司寫實風格做的好,有的影視級風格、3D 做的好。絕不是一家廠商能把所有的事情做好,不同公司和用戶之間也不是完全重合。因此,賽道的擁擠并不會影響我們按照自己的節奏前進。
2. 商業化過程中那些交過的學費
9. 都說這代 AI 創業者,DAY1 就得既要星辰大海,又要腳踏實地。從我們創業第一天起,我們就非常有危機感意識,就想着怎麼樣去找 PMF。我們在商業化方面走得比較早,也比較快。雖然我們融的錢并不是最多的,但是花的每分錢、招的每個人、我們都是想明白的。
10. 這也和我之前在京東所受的訓練有關。京東是一家零售企業,毛利比較低,所以公司文化講究精細化運營。很多時候,老板會用極限思維,就是用最少的資源來做成一個業務。除此外,產品三要素——成本、效率和體驗,也被再三強調缺一不可。這放在任何公司,任何產品也都成立。我們公司對商業化做了很多嘗試,也交了一些學費,慢慢的找到感覺了。
11. 做 C 端產品,我們一定要考慮的是怎麼解決雙非百的問題。現在的 AIGC 產品有兩個非百問題:一是用戶不能百分百用好產品,二是模型不能百分百生成用戶期望的效果。因此,AIGC 產品目前需要跨越兩個鴻溝:如何從技術嘗鮮者到專業用戶,以及如何從專業用戶到普通用戶。我們的 C 端產品增長勢頭強勁,前不久也出現在 2024 中國 AI 產品榜出海產品潛力獎榜單上。
12. 至于企業端,以前我在京東做供應鏈分析時,就了解到中國企業雖然數量多,但真正規模化的企業并不多。這種情況下,讓企業 " 買東西 " 還是比較難。中國的 SaaS 也一直很難破局,但 AIGC 技術出現後,有可能改變這種處境。
13. 做企業服務,我們的 KA 客戶,主要是一些央國企和頭部的互聯網企業。去年,我們給品牌商做上架的商拍產品叫 PixMaker。今年戰略更新後,我們開始做營銷素材的生產,特别是為短視頻的營銷生產提供工具。因為我們覺得 AIGC 相關的最大產業是内容生產 , 而内容生產裡最大部分是跟營銷相關。目前,我們已經有四萬多家合作的中小企業,大企業也有超過百家。像我們跟運營商合作推出的 AI 視頻彩鈴,就可以把我們 AIGC 產品變成一個真正的國民級產品。
14. 此外,我們比較關注工具化和 SaaS 服務。我們覺得國内有個好處,是可以先通過服務大客戶把產品打造好,再反向去出海做 SMB(中小客戶)服務。SMB 和大 C 或專業個人用戶,產品邏輯基本一樣,都不需要做點對點的服務,我們已經有好幾款產品做得不錯。說到底,商業化我們主要做了兩件事:一是給創作者提供好的創作平台和内容生态,二是給需要做營銷的品牌企業做好廣告内容生產,未來我們也會探索從生產到投放環節的嘗試。
3. 這代創業者的融資解法
15. 前不久,我們拿到兩筆融資。一筆是市場化基金,一筆是國資,我們把 Pre-A 輪和 A 輪放在一起了。前者是專注于文化科技領網域知名頭部基金敦鴻資本,後者是以合肥產投為主的國資基金,也包括安徽省人工智能母基金、湖北省長江電影集團有限公司等。現在的 AI 初創公司很難去融美元基金的錢,這是不争的事實。所以,我們現在是兩條腿走路——國資的在談,市場化和產業資本的也在談。
16. 拿國資融資時,我覺得要考慮國資背後的政府着力發展的產業方向是否和公司方向吻合,以及能否把公司往龍頭或鏈主企業打造。現在的國資,比如像合肥產投,他們也有很專業的視角、看法和盡調,有基于市場的判斷。而且國資也代表了當地政府的一些產業方向,初創公司也可以借助這種勢能。
17. 去年我們第一輪融資,來自一個名為 " 中喝大 " 的中科大校友群。這個群大概 100 多個人,基本由中科大一些企業家和學者組成,平時經常一起組織校友活動,做一些創業方面的交流。就是這個群的 15 個中科大校友,組成一個合夥人 LLP,來支持了我們的第一筆融資。
一直以來,中科大的培養模式都是培養偏數理化的科學家,所謂 " 千生一院士 "。但在工科以及商業方面就顯得不那麼突出,所以他們就想一起扶持一個人來做這件事,而我正好也想出來創業。這筆錢被稱作 " 中喝大種子一号 ",可能很快就會有種子二号和種子三号等。
18. 最開始融資時,還有一些美元基金進來,他們喜歡大故事,越星辰大海越好;但後來,美國法令條款出來後,很多美元基金就不敢投了,我們就換成了人民币架構。關于美元還是人民币,我覺得取決于你的業務在哪裡、客戶在哪裡。如果未來我們的業務真的能做到全球化,我們也可以去拿美元基金,架構也是可以調的。
19. 三年前你出來創業,100 塊錢随便拿;但現在,70% 的美元基金已經不可能了,還剩 30% 的人民币又四處分散。可能其中只有一小部分是產業基金,而且現在產業資本也變謹慎了。目前多模态的創業公司,能在外面融資的,現在也沒幾家。如果在十年前,至少得有十幾家吧。但邏輯都是一樣的,如果沒有商業化數據,最後誰來接盤?我過往的工業界經歷告訴我,一家公司一定要創造真正的商業價值,要給股東創造價值,否則這個公司沒有意義。
20. 我經常跟我的投資人說他什麼時候可以退出。我們的上限有多高,我不知道,因為很多時候取決于大勢和一些偶然;但我會告訴他,我們的下限有多高。那就是,我會保證我們的公司健康、穩定地去運行。
4. 浪來時,要跟着跳起來
21. 創業讓我覺得我的人生從未如此完整過。在一個大公司做高管,只要把技術或者團隊管好就行了,至于戰略,你後面還有老板。成為一個創業者就不一樣了,你後面沒有人了,所有的問題最終都會到你這裡來,而你必須把它們終結。
22. 每個加入創業公司的人,一定要自己先做好心理建設,你必須得自己想清楚。否則遇到一點點困難,就會想我憑什麼要來受這個罪?我經歷過技術到產品,中間又做了一段商業化,但真正創業時發現還需要更多的東西。
23. 2015 年左右,四小龍起來時,我還在微軟。當時很多人找我出來創業,我沒出來。一是覺得自己羽翼沒豐滿,學術上還可以再往前一步;另外覺得那波浪潮的商業模式還比較薄。我選擇在 2018 年出來,是覺得自己學術已經有了一些積累,更想去 all in 一個產品。
24. 在微軟研究院,我們就經常說,從一個技術到一個產品,可能需要一百個工程師;要把產品賣好,可能還需要一百個解決方案專家或 BD, 可見中間的 Gap 有多大。當時我就想,我一定要找個地方去把鏈條打通。後來去京東,我做的每項技術都用到了產品裡。這個過程可以看作:從技術到產品,到一條業務線,再到一家公司。
25. 當時選擇視頻這個賽道,也是一種理性思考的結果。去年我們判斷,做大語言模型競争過于激烈。而視頻生成在國内和國外的差距并不大。另外,商業模式上,大語言模型是用在人機互動和理解上,講究的是準确性,出現幻覺會比較糟糕。而視頻生成是一種數字創意產業,用戶不會那麼在意幻覺問題。去年 3 月公司成立,5 月拿到第一筆錢,8 月第一版智象模型就在 HiDream.ai 網站上線了。當時,我們是全球第一個上線文生視頻的 AI 公司。
26. 我們既做模型,又做應用。如果模型不自研只做應用,就太單薄了,很可能被模型擊穿。但我們做的不是通用模型,而是垂類模型。我覺得只要保證在這個領網域裡面,我們模型的能力一直是全球最好那一批,以及我們的產品能解決好用戶體驗的最後一公裡問題,這家公司就能成立。
27. 一路走下來,會發現做企業家,比做科學家挑戰更大。科學家可以每天只需要想 0-1 的創新,不需要解決具體的產品化問題;而對于企業家來說,做完 0-1 後,還得把 1 做到 100,再做到 10000。這個過程,你要消除自己的 ego。讓自己從之前某個專業的頂峰先下來,自我清零,再去爬另外一個頂峰。創業時,我就是在主動打破自己的舒适區去尋求這種改變。
28. 現在的環境下,創業者确實需要成為六邊形戰士。但我現在越來越享受不确定性。人工智能浪潮,往前看 60 年,是三起三落。我們現在正處于第三波浪潮的中間,還沒往下落。我始終覺得人要順勢而為。當浪潮來臨時,不要逆流而動,而應順勢跳躍,乘勢而上。
29. 我願意把未來十年放在這個公司,把商業從頭到尾經歷一遍。如果未來有機會,我希望可以把這些經驗傳授給年輕人。在這樣一個環境下,有很多事等着你去做,這也很好。為什麼很多财務自由的人要去登一次珠峰,就是因為人會始終想着去找新起點,而不是閒着,驟然老去。