今天小編分享的互聯網經驗:AI長文本之戰:Kimi快跑,大廠圍剿,歡迎閱讀。
文 | 周鑫雨
編輯 | 蘇建勳
一條名為 "Kimi" 的鲶魚,将大模型公司卷到了長文本的新戰場。
這款來自 AI 獨角獸月之暗面的大模型對話產品,最大的标籤就在于 " 長 "。上下文視窗的大小,代表着一個模型的記憶力。視窗越長,模型單次可處理的文本就越長。對用戶而言,模型能讀懂的文字越多,在學習、工作等場景下就越有用。
深谙營銷之道的月之暗面,是國内乃至全球範圍内,第一家将 " 長文本 " 作為标籤的大模型公司。2023 年 10 月 30 日,打着 " 全球首個支持輸入 20 萬漢字 " 名号的 Kimi Chat 就快速在一堆卷榜單、卷參數的模型中,擁有了辨識度。
Kimi 有多火?國信證券的調研顯示,從 2023 年 10 月到 2024 年 3 月,Kimi 的 DAU 從 10 萬攀升到了 300 多萬,翻了 30 倍。自春節起大規模投放廣告後,SimilarWeb 數據顯示,Kimi 的訪問量在 2 月增長了 107.6%,僅次于百度的文心一言和阿裡的通義千問。3 月 21 日,無法承接過多用戶的 Kimi App 和小程式一度宕機,用戶需要排隊才能正常使用。
Kimi 的爆火,還直接牽動了股市——一些與月之暗面有合作傳聞的上市公司,被冠以 "Kimi 概念股 " 之名,股價飙升。後續紛紛出來辟謠的海天瑞聲、中廣天擇,已經先吃上了 Kimi 的紅利,在 3 月 20 日應聲漲停。這段時間,滬深互動平台最多的問題是 " 公司是否與 Kimi 助手有合作 ",又或是 " 公司有接入 Kimi 嗎 "。
網上流傳的 "Kimi 概念股 " 名單。
在 2024 年 3 月 24 日的一場用戶活動上,月之暗面的幾位產品負責人直言:" 我們不敢說太多,還是希望大家關注產品本身。"
而一場對 Kimi 的長文本圍剿戰,也已經在大廠中打響。3 月 23 日,360 AI 浏覽器宣布内測 500 萬字長文本處理功能。百度的文心一言也被曝将在 4 月開放長文本功能,長度在 200 萬 -500 萬。阿裡的通義千問則一口氣免費開放了 1000 萬字的長文檔處理功能,坐上了 " 全球第一長 " 的寶座。
可炮制的技術,被驗證的需求
Kimi 帶起的長文本之火,無外乎兩個原因:技術門檻不高,市場需求已經被月之暗面初步驗證。
2023 年 10 月 9 日,Kimi 帶着 " 全球首個支持輸入 20 萬漢字 " 的标籤走進大眾視野。彼時,這一上下文視窗長度達到了 Claude-100K(約 8 萬字)的 2.5 倍,GPT-4-32K(約 2.5 萬字)的 8 倍。
不過,多名從業者對 36 氪表示,長文本處理的技術壁壘并不高。長文本建模的方案,主要有外部召回(借助外部工具處理長文本或者利用外部記憶存儲上下文向量)、模型優化、注意力計算優化三種,而每一種都有公開的研究論文和技術方案。
很快,Kimi"20 萬字 " 的記錄就被他人打破。2023 年 10 月 30 日,Kimi 首發僅過了 21 天,王小川的百川智能就推出了上下文視窗達 192K 的大模型 Baichuan2-192K,單次能處理 35 萬個漢字。11 月,王座再次易位,李開復成立的零一萬物,又發布了能夠處理約 40 萬字的大模型 Yi-34B,是 Kimi 的約 2 倍。
長文本帶來的模型競速,最根本的原因,還是在于看到了龐大的消費群體。
"C 端用戶對大模型的需求無外乎兩種,一是提效工具,二是娛樂工具。" 一名 AI 從業者告訴 36 氪。他認為,目前 AI 對短文本的理解和生成能力,還沒完全超過人類,比如看咨詢、寫短文案," 人用在修改 AI 生成的文案的時間,其實不比自己從頭想來的少。"
但大模型相較于人的競争力,恰恰在于理解長文本的效率。"10 萬字的論文,一般人讀完起碼要 30 小時,還是在不休息的情況下,但大模型只要幾分鍾。"
一名法律行業 AI 產品經理向 36 氪提及,問答機器人、模拟法庭等 AI 產品在專業度高、實踐性強的法律行業都跑不通,唯一能跑通的只有對判決文書等長文本的總結,而 "Kimi 是目前律師等法律專業用戶認可度最高的一款 AI 產品 ",不少律師用 Kimi 來總結資料,輸出法律文書。
Kimi 的火爆,是苦于 C 端變現途徑的大廠所垂涎的。在大模型落地的打法上,體系龐大的大廠們,采用的基本是模型 + 雲服務、AI 功能 + 原有產品的保守打法。在 B 端,這樣的打法初見成效。百度在 2023 年的财報中,強調了大模型對雲等 B 端業務的推動。
但大模型對 App、搜索等 C 端產品營收的助推,依然是個謎。百度财報顯示,2023 年 12 月,百度 App 的月活達 6.67 億,同比增長了 3% ——然而,這個數字與 9 月的 6.63 億基本持平,不及 6 月的 6.77 億。
而 Kimi 證明了,不采用和其他產品的 " 打包 " 模型,大模型本身也有拉新造血的潛力。通過月之暗面這個對手,大廠們完成了對長文本的市場驗證。
Kimi 的難題是商業模式,大廠的難題是獲客
但要讓長文本真正造血,廠商們擔心的仍然是高昂的成本。
日前,Kimi 的獲客成本就引發了讨論。據新浪科技獲得的數據,算上廣告投放和算力成本,Kimi 每個用戶的獲客成本達 12-13 元,按照近一個月 17804 的日均下載量計算,Kimi 每日的獲客成本高達 20 萬元。
Kimi 在 B 站投放的廣告。
每日 20 萬元的獲客成本,加之随着參數規模水漲船高的大模型研發費用,對尚未商業化造血的月之暗面而言,燒錢的局面依然要維持一段時間。
初創公司的另一難題,則在于如何運營如此龐大的用戶群體,并提供穩定的服務。2024 年 3 月 21 日下午,由于用戶數超出負荷,Kimi 的 App 和小程式一度無法正常使用,用戶需要排隊等待。
但月之暗面的困境,對于作為後來者的大廠們而言并非難題。億歐智庫 2022 年 3 月的數據顯示,中國互聯網企業的平均獲客成本在 380-580 元之間。
可以說,Kimi 人均不到 20 元的獲客成本,對于大廠而言,反倒是用更低的獲客成本,找到了新的流量入口。
而在服務質量上,算力資源、人力資源充足的大廠,更容易輸出穩定的服務。而在技術上,一名 AI 從業者告訴 36 氪,将可以處理 1000 萬字的通義千問後和 Kimi 比較,可以發現同等文本的解讀,通義千問的總結完成度略高一籌。甚至于,360 的長文本功能,增加了摘要和思維導圖的能力。
但後來者的劣勢,也恰恰在于失去了先發優勢和辨識度。
當面向龐大的 C 端用戶,亮眼的營銷手段顯得格外重要。被當成過河搭石的 Kimi,勝在有一個别出心裁的亮相,早早就貼上了 " 長文本 " 的标籤,在一眾大模型模糊的面孔中打出了差異化。至少提到 " 長文本 ",用戶腦海中最先跳出的,大概率是月之暗面的 Kimi。
而大廠的包袱,還在于要為用戶提供更完整、更復雜的產品體系。不少體驗過各家大模型產品的用戶都告訴 36 氪,大廠模型產品的 UI 設計、插件生态很復雜,功能過多,導致用戶的需求要經過多步操作解決。但 Kimi 的界面很簡潔,對于用戶而言,使用門檻反而降低了。
Kimi 首頁。
Kimi 的爆火已經為商業化創造了時機。月之暗面表示,有用戶反映是否可以用付費解決等待的問題,今年公司會有初步的商業化方案。
只是找到合适的商業模式,證明自身的造血能力,是月之暗面接下來面臨的考題。面對異軍突起長文本之戰,當 Kimi 在用戶前構築了一道付費牆,能否貼牢 " 長文本第一家 " 的标籤,還未可知。
歡迎交流