今天小編分享的科技經驗:DeepSeek開啟“開源周”,與我們有什麼關系?,歡迎閱讀。
就在剛剛,DeepSeek 宣布,從下周開始,他們将開源 5 個代碼庫,以完全透明的方式與全球開發者社區分享他們的研究進展,并将這一計劃定義為 " 開源周 "。
DeepSeek 正以開放的姿态參與重構全球 AI 生态格局。置身于 AI 時代的我們,不得不思考,如何讓 DeepSeek 參與到我們的事業之中。
" 早在這次 DeepSeek 破圈之前,AI 整體的能力就已超過 99% 的人類。"
" 我越研究 AI 越感覺痛苦,就像舉着錘子找釘子,每天都在思索要做點什麼。
在長時間的迷茫之後,我才驚覺,最大的機會往往都在自己的認知、自己的專業領網域裡。"
" 如果你開發的功能只能幫企業替換掉 10 個員工,最好不要做 "。
前天,Monica.im 產品合夥人張濤老師坐客混沌,以技術演進為脈絡,揭示了 DeepSeek 如何通過「格式激勵和結果激勵」實現思維鏈自主進化,并在博士級難題上做到了跨越式突破,其底層邏輯恰似 "AI 覺醒思考本能 "。
張濤老師曾任神策數據副總裁、飛書海外產品負責人、光年之外產品負責人,是一個熱愛技術的產品人。春節之後第一周,他以萬字深度拆解 DeepSeek R1 是怎樣煉成的,在創投圈引起廣泛讨論。
在這場技術革命中,創業者如何抓住時代紅利?張濤的演講不僅是對 DeepSeek 的深度解碼,更是創業者的行動指南。他提醒我們,在這場 AI 浪潮中,唯有抓住行業痛點,将 AI 轉化為解決問題的工具,才是定義未來的關鍵所在。
DeepSeek 驚豔全球在于 " 非共識 " 的模型訓練方法
OpenAI 發布了 o 系列的模型,它在博士級别的難題上的表現遠超之前幾款,基本上可以達到 83 分。從以前的 13 分到現在的 83 分,這是一個十分誇張的進步,推動它進步的原因正是我剛剛提到的思維鏈。
既然思維鏈這麼厲害,那麼全世界的 AI 公司應該都會竭盡全力實現。但是該如何實現?OpenAI 從 2023 年年終開始,基本不再對外發布任何的技術報告,在他們發布的最後一篇報告裡,有一個很關鍵的内容,叫過程激勵模型(process reward model)。
在提出過程激勵模型的同時,OpenAI 還放出了過程激勵的數據集。自這次報告之後,全球很多廠商都在研究如何通過過程激勵復現 o1,但做起來才發現極其困難。但是與此同時,有兩家廠商卻找到了不一樣的路徑,它們都是我們中國的廠商,一個是 Kimi,一個是 DeepSeek。
其實這條路徑并不復雜,它基于兩個最簡單的規則:準确度激勵和格式激勵。通俗來說,準确度激勵意味着它做對了就獎勵,做錯了就不獎勵;格式激勵意味着它在得出最終答案前,還需要進行思考。它們都指向了一個最基本的激勵原則——要求做對,并且有好的思考。在給定這兩個激勵的預設下,訓練模型的過程中就發生了一個非常神奇的現象:随着學習過程的強化,模型產生的思維過程越來越長。這說明由于這兩種激勵的約束,模型自動意識到了要把題做對的前提是思考的過程要更嚴謹。
不得不說,這是一個令人震撼的現象。
DeepSeek 的出現帶給全世界非常大的震撼,因為之前大模型基本上被 OpenAI 一家統治,而它很大程度上松動了 OpenAI 一家獨大的局面。并且 DeepSeek 采取了一個開源的姿态,面向全世界,這一舉措基本上改變了整個 AI 行業的底層生态,撬動了整個行業的板塊。
AI 創業最好不要先從 " 降本 " 切入
我相信從 ChatGPT 到 DeepSeek,AI 已經一次又一次地讓我們為它震顫。比如它的影像理解能力,能夠做到立即做出準确的判斷。再比如影像生成能力,也能做到生成惟妙惟肖的人像模型,讓我們分不清虛實。甚至現在很多人已經用 AI 的視頻生成能力創作視頻内容,講述一個完整的、有趣的故事。
可以說,三年前的我們都難以想象當前的世界會發生這樣的巨變。那麼,它帶給我們哪些新的可能性?
最直觀的影響是降本。比如以前某個崗位需要十個員工接電話,現在只需要一個 AI 就能搞定。但這裡有一個關鍵要點,降本從來不是企業思考的核心,沒有企業是通過降本實現業務增長的。因為當企業在賺錢的時候,其實不會關心降本,而一旦它開始關注降本,大概率就意味着進入了下行周期。
因此每當有創業者來問我 AI 創業應該做些什麼,我給他們的建議都是 " 如果你開發的功能只能幫企業替換掉 10 個員工,最好不要做 "。因為中國的勞動力成本本來就不高,替換掉 10 個員工對企業來說算不上剛需。我們真正需要尋找的是以前 10 個員工在做的崗位,如果并不是因為公司只想讓 10 個員工做,那麼這背後受限于什麼要素?比如招不到人,比如管理難度大。如果這個崗位有 500 人在做就能夠帶來業務線性增長,就很适合成為 AI 創業的領網域。
所以除了降本增效之外,我認為對于創業者來說,AI 最重要的價值是他創造了一種全新的商業模式的可能性,讓以前一些因為部門不經濟因此無法實現的創業設想變得可行。這正是這個新時代裡賦予我們的機會,而不是用 AI 換掉幾個員工、省掉一點開支,這都是小錢,找到新的商業機會才能賺到真正的大錢。
聽到這裡,可能會有人想,AI 領網域這麼大有可為,不做 AI 的話是不是無路可走?其實完全不是這樣的。我做 AI 相關行業已經兩年了,這一期間我越研究 AI 越感覺痛苦,就像舉着錘子找釘子,每天都在思索要做點什麼。在長時間的迷茫之後,我才驚覺,最大的機會往往都在自己的認知、自己的專業領網域裡。
給大家舉個例子。前年在我研究影像技術時,我發現有種技術可以做到 1 秒鍾生成幾十張圖,對于我來說這個技術并沒有太多用處。所以即使我有這樣的技術,但我卻并不知道怎麼用。後來回重慶的時候我把這項技術演示給當地一個做建築師的朋友,他十分震驚,立即投入使用。以前他們做一張渲染圖是以小時為部門計算時間成本,現在只需要幾秒種,并且是實時的。據他反饋,雖然最後的渲染圖無法用于施工,但現在與甲方溝通的時候可以從各個角度給出方案,如果有需要修改的部分,可以立即修改。可以說,通過使用 AI,極大地提升了他們工作和溝通的效率。
因此我在這裡建議大家多結合自身的行業去思考,因為每一次解決問題的過程,可能會開拓出 AI 創業的新思路。
全球 AI 滲透率遠低于人們的想象
由于我們處在行業裡,因此會誤以為 AI 已經遍布全世界,但其實去年這個時候,OpenAI 的全球用戶總數還不到世界人口的 3%。這一現象意味着全世界絕大多數人都沒有使用過 AI,因此每年都有相當多的人第一次嘗試 AI,而當他們在初期使用時,可能會困惑要從何入手,是語音生成?文字聊天?還是視頻制作?
我們認為,大模型的能力是一台發動機,但對于用戶來說最重要的是車,因此我們将自身定位為造車的車場。
未來是什麼樣子的?我認為純聊天機器人是 AI 發展過程中的一個過渡階段。因為對于全世界大多數人來說,提問的能力有限,也缺乏提問的動機。這使得 AI 的核心表現對多數人來說沒有價值,如果要走向更廣大的市場,AI 的發展必須貼合用戶需求的最大公約數。
我們目前做的事情其實就是努力跟随這個方向。