今天小編分享的财經經驗:DeepSeek爆火的啟示:中國如何培植創新基因?,歡迎閱讀。
" 深度求索(DeepSeek)将來怎麼樣不得而知,但它的橫空出世至少告訴世界,中國很多‘小角落’能夠爆發出大能量。"
在近日由盤古智庫舉辦的研讨會上,談及正以破圈之勢引起全球巨震的國產 AI 大模型 DeepSeek 時,國盛證券首席經濟學家熊園表示,如果從宏大叙事的角度來說,它提高了中國的科技知名度,也讓國際資本重拾擁抱中國資產的信心。" 一位外國基金經理告訴我,他們内部從來沒有寫過對中國超過 40 頁的報告。但因為 DeepSeek,他們剛剛完成了 60 頁的報告。"
春節前夕,中國 AI 初創公司 DeepSeek 發布的開源模型 DeepSeek-R1,以不到 OpenAIGPT-4o 模型十分之一的訓練成本,達到與之接近的性能,并實現開源,颠覆了 AI 行業認知。而這家初創公司成立不過一年多,脫胎于一家以量化交易為主的對衝基金,公司 85 後創始人梁文鋒成長于 " 廣東一個五線城市 "、浙大碩士學歷出身,其團隊成員均為本土研究人員。
于是,這一典型的中國版 " 大衛戰勝歌利亞 " 的故事,引發國内外資本市場、學界和產業界的廣泛讨論。國際市場重新審視中國企業創新實力的同時,國内市場也開始思考金融資本在支持科技創新中的角色,探索 DeepSeek 的成功能否被復制。
"DeepSeek 現象既是偶然,也是必然。我國去年的研發投入比 2014 年多了 2 萬多億元,這一規模可能在全球也是從來沒有發生過的,與此同時,企業的主體地位也在逐漸形成。但賦能企業還缺少一些機制,目前研發投入靠前的企業還是以國企主導,地方還有待營造出更好的創新創業環境。" 九三學社中央副秘書長、科技專委會主任張旭說。
創新及創新人才的再定義
近期以來,将全球視線吸引到中國市場的主角有二:一是超過 ChatGPT 成為全球增速最快的 AI 應用,并以算法集成創新突破算力限制,以開源模式引發 " 科技平權 " 讨論的 DeepSeek;另一個是中國影史首部票房破百億元、進入全球票房榜前 11 名的電影《哪吒之魔童鬧海》。
優實資本董事長邢傑表示,DeepSeek 掌舵人梁文鋒與魔童哪吒有相似之處。" 梁文鋒就是一個活着的哪吒。他不是‘名門正派’,但也‘殺出了一條血路’。"。
邢傑解釋說,如果将 DeepSeek-R1 的推出放回到 AI 產業發展的時間軸上,它的影響力可能比較有限,但 DeepSeek 的 R1 恰恰是在從預訓練向推理轉向的大模型第二階段,在國内算力資源受限的情況下,達到與全球頂級大模型 OpenAI o1 比肩的性能,由此打破此前業界圭臬——大模型訓練的效率或者是創新的速度,根本上取決于算力大小。
" 有時候匮乏反而是财富,正是因為算力的匮乏倒逼了 DeepSeek 做匯編語言方面的編程,就像以色列資源極度匮乏,但反而極度創新。這是值得國内目前處于弱勢地位的行業和機構思考的。" 邢傑說。
邢傑認為,Open AI 發表論文說過程性激勵非常重要,其确實也沿着這個思路獲得成功,但閉源之下,業界只能根據其提供的思路往前走;而 DeepSeek 發現了一件很簡單的事情,就是改過程激勵為結果激勵,通過推理模式的形成能夠以高性價比達成類似性能。
矽谷知名風險投資人馬克 · 安德森(Marc Andreessen)近期在接受媒體采訪時也提出,這家中國公司想出了如何使用更便宜的芯片(獲得高性能),将使用變得更加高效。與此同時,他們以開源的形式将經驗提供給全世界,為任何想要進行類似工作的其他人提供了路線圖。
" 六個月前,這些還非常深奧、極其昂貴且專有。如今,它變得對每個人來說都是免費且永遠可用的。" 馬克 · 安德森說,在美國,很多大型科技公司、互聯網公司和初創公司,要麼正在基于 DeepSeek 進行重建,要麼将其整合到他們的產品中,要麼研究他們使用的技術,并用它來改進現有的 AI 系統。
多名國内業界人士認為,DeepSeek 的橫空出世,讓市場開始重新定義創新。
DCCI 未來智庫與 FutureLabs 未來實驗室首席專家胡延平認為,DeepSeek 的亮點,按實際價值其實依次是強化學習、混合專家模型 MoE、知識與模型蒸餾、多頭注意力、多 Token 預測、混合精度訓練和 PTX 等,盡管沒有一項是 DeepSeek 自己完全原創、獨創的,但是 DeepSeek 成功地進行了非常系統的再創新,使得 DeepSeek 模型在推理能力方面大大提升并實現了降本增效,也讓模型能力的展開成為可能。
圖靈新智算創始人暨董事長劉淼持相近态度。他提出," 在目前 AI 領網域幾乎很難有從 0 到 1 的原創了。"OpenAI 第一個走出來,利用算力、數據、算法作出了智能湧現。DeepSeek 則是把每一個環節做到極致,達到了高質量、低成本的效果。它的成功證明了,以工程學的路徑達到整個系統優化是完全可行的。
而在邢傑看來,DeepSeek 的成功,也提示着中國社會和各級組織,需要看到一類 " 非共識、非主流、非中庸 " 的創新人才。越前沿的東西可能越是非共識的,這需要從機制上保證,從資源上支持,從文化上給予土壤。
一名業内人士對第一财經表示,即便實施開源,國内 AI 企業短期内也很難成為第二個 DeepSeek,其背後的原因就在于很難有企業擁有足夠的自有資金、能力和恒心,專注于純技術。
另一方面,DeepSeek 的 " 免費 " 和 " 高性價比 " 不免令人想起電商界的拼多多。不過,目前,DeepSeek-V3 API 服務的優惠價格體驗期已結束,從 2 月 9 日開始已調整新的付費價格。
" 一個很有意思的現象是,在 DeepSeek 的 API 漲價 200%-500% 區間時,如阿裡雲等實施大幅度降價。這種‘你漲價我降價’的現象,我稱之為叫 AI 大模型的内卷以及反内卷。AI 大模型領網域比任何其他領網域都更需要反内卷,如果大家都沒有錢掙,就變成了少數人的遊戲,這會極大妨礙整個創新的進程。" 胡延平說。
如何影響中國創新路徑?
"DeepSeek 以及《哪吒 2》的破圈,對中國創新的體制機制、對各方面都是一次觸動。我們必須重新審視市場的力量、基金的力量、場景的力量,以及年輕人的力量和寬松環境的力量。總之,DeepSeek 的爆火不僅是一次技術突破,更是對創新思維的肯定。" 盤古智庫理事長易鵬說。
梁文鋒成立量化基金幻方量化,曾是熊園的客戶之一。後來,梁文鋒在接受采訪時曾提出,幻方量化在一定程度上增強了該團隊對技術驅動創新的信心,這促使其後來成立了純技術公司 DeepSeek。
Aletheia Capital 中國策略分析師陳昌華近日撰文提出,這次突破來自一家以量化交易為主的對衝基金,或許會讓人理解金融和其他服務業對經濟和科技進步的貢獻。一個現代經濟體要健康發展,需要多個產業協同進步,而一個企業最原始的訴求就是提供消費者需求。
也有業界觀點認為,DeepSeek 讓人們對于中國在什麼地方,以什麼體系,可以培植出如 DeepSeek 一般的現象級創新,產生思考。
作為中國第一批互聯網連續創業者中的一員,近一段時間以來,英諾創新空間創始合夥人、清華校友總會互聯網與新媒體專委會秘書長鄧永強經常面對三個問題:梁文鋒為何來自于浙大而非清華(全國信息工程排名第一)?這家年輕的大模型公司為何在杭州而非其他城市?站在投資人的角度,如何看待 VC 們集體錯過 DeepSeek 的現象?
另一個值得關注的問題是:這種創新為何沒有出現在科研院所、互聯網大廠或者科技巨頭公司?
" 國家戰略引領下的一些大院、大所以及相當多由地方政府合資成立的新型研發機構,他們過去在基礎研究上,包括在解決一些卡脖子問題上,形成了一種比較主流的技術創新體系。但以 DeepSeek 為代表的創新,是非常市場化的,是在一個市場空白點上實現的重大突破。" 人文财經觀察家、秦朔朋友圈發起人秦朔說。
張旭認為,對于未來的科技體制改革框架,應該有兩個轉變:第一是從 " 跟随 " 到 " 原創 " 的轉變。原創不見得是基礎研究。另外目前科技創新的人才激勵和評價體系還有一些待改進的地方,需要把機會給予更多年輕人;第二,盡管目前企業的創新主體地位越來越明顯,但政策還不夠配套。比如科研經費需要進一步向企業主體轉移。
從城市維度來看,盤古智庫學術委員會副主任委員梁春曉表示,杭州與成都兩座城市有個共性特征,就是親近小微,柔性治理。所以,這兩座城市聚集了很多的小微企業,能夠產生震驚中國和世界的成績并非偶然。
以電子信息產業密集的深圳為例,一名接近當地政府的人士提出反思:第一,杭州的創新是以軟體和阿裡生态為核心,而深圳盡管在十幾年前開始就注重原創和教育基礎設施培養,但遠水解不了近渴;第二,近五到十年裡,深圳過于注重引進大企業,但部分大廠的創新成果并不盡如人意;第三,深圳的成本不斷推高,使得不少中小企業離開深圳去往長三角。
" 目前,當地政府已經注意到了這些創新問題,預計近月内會有政策出台。" 前述人士說。
( 本文來自第一财經 )