大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

圍剿Kimi,只是大模型“新賽季”play的一環

2024-04-04 简体 HK SG TW

今天小編分享的科學經驗:圍剿Kimi,只是大模型“新賽季”play的一環,歡迎閲讀。

大模型巨頭 " 圍剿 "Kimi 的戰役,已經進行了一段時間了。想必讀者們已經從 Kimi 帶來的震撼中冷靜下來,開始理性審視 2024 的大模型 " 新賽季 "。

毫無疑問," 卷 " 長文本,是基礎通用大模型在新賽季的首個賽點。3 月 18 日,月之暗面宣布 Kimi 智能助手支持 200 萬字超長無損上下文,并開啓内測。200 萬字是什麼概念呢?《紅樓夢》等古典名著、企業财報等專業文獻,Kimi 都能 " 手拿把掐 ",展現出了極強的理解分析能力。

打擂台容易守擂難。Kimi 這位新秀的亮相固然驚豔,但其他更早問世的 TOP 級基礎大模型,也都不是吃素的,很快百度文心一言、阿裏通義千問,都宣布跟進長文本能力,直接卷到 1000 萬字。

Kimi 突如其來的熱度、巨頭的積極反撲、長文本賽事的狂飙,無不説明基礎大模型已經進入了新賽段。

Kimi 不是來終結比賽的,而是來加入這個家的。而去年倉促備戰、緊跟 ChatGPT 的第一梯隊廠商,如今也對大模型的商業化前景、落地方向等,有了更成熟的思考。

Kimi 掀起的 " 長文本之戰 ",只是大模型 " 新賽季 "paly 中的一環,接下來還會有哪些看點,我們來預測一下。

Kimi,終結不了比賽

月之暗面(Moonshot AI)是大模型賽道上,第一波獲得較大規模融資的明星創業公司。而相比同時期動作不斷的 AI 大廠如 BAT、明星企業如百川,月之暗面直到去年 10 月才交出了第一份成績單 Kimi,頗有種 " 謀定而後動 " 的味道。

從參數上看,Kimi 的長文本能力超越了當時的谷歌 gemini 1.5、Claude3,處于全球領先水平。

從市場動作看,Kimi 的宣傳,也不像其他基礎通用大模型廠商那樣謹慎,而是大規模投流,廣告鋪天蓋地,在 B 站、抖音、小紅書等平台都有信息流投放。據媒體報道,Kimi 每天獲客成本都在 20 萬,正在 " 燒錢換規模 "。

從實際效果看,有大量個人用户和企業開發者在使用 Kimi 後表示,其在中文上的理解、分析、問答能力,确實優于當時主流的國產大模型,上下文銜接更好,總結能力更強。

幾重因素疊加,更新後的 Kimi 引爆了資本市場的新一波熱情,甚至出現了 "Kimi 概念股 "。

那麼,Kimi 能 " 亂拳打死老師傅 ",一舉終結基礎大模型的比賽嗎?子彈飛了這麼久,結果已經很明顯了,不能。

一方面,随着用户規模的增多、應用場景和用例的增加,Kimi 的能力局限越來越多地暴露出來,比如有用户提到,Kimi 的編程能力跟 ChatGPT、GLM4、文心一言有很大的差距,ToC 場景下長文本處理的需求并不高頻,新鮮感過了之後,感覺沒有其他太大用處。

同時,Kimi 視為核心差異化優勢的長文本能力,并不構成真正的護城河。從其他巨頭很快就跟進并上線了相關能力,就可以看出,長文本處理技術的壁壘并沒有很高,能做基礎通用大模型的頭部廠商,都有相關技術和人才積累。

而過去一年 AI 大廠在多模态大模型、智算基礎設施、ToC 應用、Tob 客情關系等多個維度構築起的壁壘,則是月之暗面很難快速追趕的。比如,目前月之暗面還沒有發布多模态大模型,雲服務運維跟不上,難以保證 B 端用户的體驗。

目前 Kimi 面向大眾免費試用,但其付費 API 的定價,有的版本幾乎達到了 GPT-3.5 等領先大模型的數倍,後續付費轉化也要打一個問号。

總的來説,Kimi 是月之暗面在大模型技術上的一次成功 " 秀肌肉 ",但别説直接終結比賽,要跻身 " 可規模落地大模型 " 這一賽道的 TOP 席位,恐怕為時尚早。

新賽季," 遭遇戰 " 告一段落

有讀者可能會問,既然大廠有做長文本處理的能力,為什麼去年不卷,非要 Kimi 火了之後才卷?

所以説,Kimi 爆火是一個很好的契機,标志着中國大模型已經從倉促備戰的 " 遭遇戰 ",進入到了步步為營的 " 陣地戰 "。

簡單來説,2023 年 ChatGPT 橫空出世,中國的 AI 大廠是在猝不及防的情況下,極短的時間内統籌資源、組織人馬,快速跟上 OpenAI 的技術進展,一度出現了 " 大模型日抛 " 的局面。這時候最重要的是争取主動,避免中國 AI 在大模型浪潮中缺席。文心一言、訊飛星火、騰訊混元、華為盤古、百川智能、智譜 AI 等一大批基礎大模型廠商和初創機構,确實讓中國在 " 遭遇戰 " 中拿下一城。

狂奔一年,無論海内外都對大模型有了更清晰,也更務實的認知。中國的基礎大模型廠商,已經開始 " 高築牆、廣積糧 ",逐步進入到充分準備、保障嚴密、戰略穩定的 " 陣地戰 " 了。

為什麼之前不卷長文本,Kimi 出現又快速集體圍剿?恰恰是新賽季 " 陣地戰 " 開始的信号。

信号一,不打沒意義的仗。

國内基礎大模型的競争基本告一段落了。

随着 Sora、Claude3 等開源或閉源大模型都越來越強大,基礎通用大模型的投入門檻也更加高昂,不能長期拿出天文數字來卷的都心生退意,轉而去挖掘垂直場景和細分行業的機會,這也讓頭部廠商的認知度和市場認可度更加穩固。

基礎大模型廠商也開始精打細算,關注如何從硬體中壓榨出更多算力、降低部門推理成本、構建可持續的國產算力、挖掘商業化項目潛力等。而長文本處理要消耗大量的硬體資源,平白無故瞎卷,燒錢費力還未必讨好,确實沒必要。

但 Kimi 的爆火,更多是讓 ToB 場景,尤其是金融、政務客户,看到了大模型的應用價值,讀财報、讀合同、做客服,更長的文本确實能在這類知識密集型場景,發揮出更好的效果,減少幻覺問題。這代表了基礎模型的底層能力,所以 Kimi 的長文本之戰,必須打。

信号二,競争更加立體復雜。

2023 年末,大模型熱度已經開始降温。應用側落地困難,所謂的殺手級 AI 應用似乎還是沒有出現,而投入成本持續加碼,基礎模型一更新就會覆蓋創業者的工作,導致投資市場态度也偏向謹慎。于是,很多人開始質疑這一波大模型只是自嗨,唯一賺錢的只有賣鏟子的英偉達,焦慮情緒開始彌漫。

這時候,Kimi 作為一款現象級產品,确實打破了僵局。

作為一個有實際意義的應用層產品,Kimi 讓大眾再一次感受并認可了大模型的價值。根據產業規律,應用爆發往往會在產業基礎平台條件具備之後的一兩年内出現,Kimi 正處于這一時間軸的關節上,标志着 AI 應用爆發即将開始。

Kimi 對大模型價值的再度确認,也會讓接下來的通用大模型競争,從卷參數、卷 benchmark 等基礎項 PK,進入到更加復雜、多元的能力角鬥。

信号三,跑馬圈地白熱化。

這一競争階段," 遭遇戰 " 時的靈活、機動、大幹快上,就不太管用了,而需要細致部署、步步為營,跑馬圈地。

對 Kimi 的圍剿説明各家基礎大模型廠商的底層能力,會很快趨同。除非像 OpenAI 那樣,技術的飛輪效應極強,跟競争對手的差距越拉越大,否則,技術天然會擴散,很難長期成為商業秘密與護城河。

壞消息是,國内的基礎大模型,想要建立差異化優勢越來越難,沒有人能獲得壟斷地位;好消息是,政企客户更希望構建 " 模型花園 ",根據需要調用多個大模型,減少對單一供應商的依賴,所以市場仍在增長,仍然開放,大家都還有機會。

(企業希望引入的模型數量)

a16z 調研了七十多位财富 500 強企業和頂級企業領袖,發現這些公司 2024 年在 AI 上的支出預算比 2023 年增加了 2-5 倍。國内市場的智能化速度也不會遜色,更增強了對基礎大模型的需求,所以接下來,會進入到白熱化的跑馬圈地階段。

大模型新賽季,正式拉開帷幕。

長文本

只是 " 陣地戰 " 的一環

長文本,是 " 秀肌肉 " 的必争之地,但解決政企客户的切實需求,長文本卻未必那麼實用。從 Kimi 的長短板,我們可以看到目前市場更需要怎樣的大模型。

首先説説短板。前面提到了,Kimi 的長文本在很多場景下屬于低頻需求,再長的 token 只會帶來更大的計算量、更高的資源成本,對用户來説性價比不高。對此,吳恩達也認為,快速生成 token,可能比使用更強的模型更重要。長文本處理導致的硬體資源需求、GPU 短缺和雲服務能力,也是 Kimi 面臨的現實挑戰。

而 Kimi 的長板在于,在文本摘要和知識管理等任務中,發揮出了極高的生產力效能,對企業的吸引力很大。應用更友好,企業不需要從頭開始訓練自己的 LLM。

所以,長文本之戰引發的連鎖反應,會讓一些能力,成為 battle 重點:

1. 與雲的深度融合。Maas 服務會成為模型購買決策的首要原因之一,繼續深化、細化。

2. 對 Agent 開發的支撐。基礎大模型很難提供所有端到端的解決方案,長文本處理是應用層公司的舞台,通過基礎大模型 +Agent 式工作流,去解決客户的專有問題。而 Agent 式推理拼的是 token 生成速度,而非文本有多長。試想一下,如果一個金融客服助手半天憋不出一段話,即使生成的效果再好,用户也不會有耐心等待。所以,長文本能力并非應用型企業選擇基座模型的唯一标準,甚至不是最重要的标準。

3. 生态規模。Kimi 的爆火説明,大廠不可能壟斷所有應用方向。利用新的技術能力(如長文本處理)來解決新的問題,創業公司和個人開發者更具備貼近客户、深入場景的優勢,為各類行業用户的特定需求進行微調、定制。大模型的商業城池,必須由眾多生态夥伴一起來守,誰能在 2024 奠定生态的規模優勢,是接下來博弈的關鍵點。

總的來説,大模型落地,是一個復雜的系統工程。2024 進入 " 陣地戰 " 的大模型市場,準備更加充分,作戰更有條理,商業化戰略也日益清晰。基礎模型廠商,将在一次又一次的迎敵與防御中,構築起系統性的攻防能力。

一個平台級的大模型公司,一定會是萬億級别,也一定會誕生在中國。讓我們拭目以待。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們