今天小編分享的教育經驗:傅盛2024開年演講:這20年對我最重要的一個詞,歡迎閲讀。
回顧2023年,我們見證了AI大模型如何席卷全球,我們相信這會成為科技界的風向标,很少有技術在這麼短的時間内可以激發如此廣泛的社會關注和熱烈的讨論。
站在2024年的起點,我們也堅信這将是AI大模型應用的關鍵之年。作為AI大模型應用派創業者,傅盛老師帶領獵户星空秉持長期主義的心态,在AI領網域七年磨一劍,躬身入局,聚焦大模型如何在企業落地應用。
傅盛,獵豹移動董事長兼CEO、獵户星空董事長、混沌學園三期學員。
1月21日,傅盛攜手混沌舉辦了2024·傅盛的AI開年大課《每個企業都有私有化大模型的時代到來了》,并重磅發布獵户星空企業應用大模型。本次演講也邀請了多位重量級嘉賓:360集團創始人周鴻祎、極客公園創始人&總裁張鵬、中國移動通信集團終端有限公司副總經理汪恒江、亞馬遜雲科技大中華區解決方案架構部總經理代聞、混沌學園合夥人張雷……
以下内容根據傅盛演講内容整理,關注混沌學園視頻号可以觀看視頻回放。
Think Different:創新的不二法門
過去的2023年是人類科技史上特别重要的一年,我特别喜歡的科普作家卓克,把2023年定義為"人類歷史的第三個科學奇迹年"。所謂科學奇迹指的是,一個新事物的出現徹底改變人類社會。
第一次,1666年,牛頓開辟光學,創立微積分、推導出引力公式,使得現代文明、工業大廈由此展開,改變了整個人類社會的面貌。
第二次,1905年,愛因斯坦發布了狹義相對論、 質能方程等四篇論文,不僅徹底改變了物理學,還為 20 世紀的許多技術進步奠定了基礎。
第三次,2023年,GPT引領AI浪潮,技術的底層範式發生重大變化。
于是,我們知道AI将帶來整個社會的底層重構,意味着所有人的工作方式、思考方式都要發生變化。那麼,我們如何抓住這次創新大潮?
今天談的是創新這個非常難的話題,我有很多經驗可以與大家分享。我想從個人經歷的科技大潮小故事開始。我在2002年進入互聯網行業,那時候看到互聯網的蓬勃發展,每天起早貪黑地工作,非常卷。現在回頭看,每個大變革的時代,作為普通人往往都是類似的心态,擔心自己沒有辦法抓住浪潮。
32歲時,我旅行到了斯坦福,站在斯坦福的大草坪前我震驚了,工作日他們怎麼會有時間跑步,之後又看到高速路上在堵車,大家紛紛拖着小船、遊艇要去度假。我震驚的是為什麼在北京,大家每天工作加班累成"狗",但在硅谷的人卻如此休閒,而很多創新卻恰恰來自于這些休閒的人。
我意識到,勤奮并不是可以做成一些事情的充分條件,因為你勤奮,對手會比你更勤奮,你不要利潤,對手可以虧着賣,尤其是大公司,它可以不計成本地把你按下去。
在遍訪這些美國初創公司後,我意識到同質化的勤奮只會更卷,不同的道路才可能勝出。我後來仔細想,到底什麼叫做創新?
所謂創新,就是找到不同的路,以更少的投入換取更大的產出。
1997年,重回蘋果擔任CEO的喬布斯,推出了著名的宣傳片Apple Think Different,大家都認為這代表了一種特立獨行的文化。我認真思考這件事,猛然意識到,Think Different不是特立獨行的文化,而是創新的底層思維模式。
我記得在跨年的時候我參加了一個圍爐夜話的節目,有幾個90後的年輕人説,你們趕上了好時代,我們這個時代太卷了。
卷的思維模式是 Think Better,而創新的思維模式是 Think Different。
與其更好,不如不同。在今天的時代下,Think Different是創新的不二法門,只有找到不同的路,才有可能真正實現爆發。
有一本書《為什麼偉大不能被計劃》,按照書中的説法,OpenAI的出現根本不是必然,甚至是偶然。正是因為有人在大家看不到的道路上在嘗試,他們發現了一條路,并且走通了這條路。但新的道路不在大多數人的認知地圖中。正因如此,Think Different從最開始不被大多數人看好。
回到我個人的創業經歷中來,正是因為想清楚了這個底層規律,所以在2012年,國内移動互聯網創新最卷的時候,我決定讓獵豹移動Think Different,All in出海。那時候國内競争激烈到什麼地步呢?每家公司都在説要拿到移動互聯網的船票,連馬化騰先生都説,微信如果晚出來三個月,那麼騰訊就要被颠覆。
在認真考察了美國的移動App後,我發現他們做得好像不怎麼好,那我們為什麼不去做海外?獵豹移動是中國第一批大規模出海的互聯網企業。大家都知道的TikTok,我們是最早的天使投資人,為什麼要投他?那時候沒有人相信上海10個人的團隊做美國的音樂短視頻App可以火起來,而我相信Think Different,不同的路總是有機會。
到了2016年,共享經濟如火如荼,那時候我就想,如果再開啓一條曲線,我想做不同的事情。于是我又做了一個決定,讓獵户星空 Think Different,All in AI。當時我看到AI的時候,就覺得這是一次範式的變化。
由于那個時候起步較早,我們AI也有一些技術優勢。可能大家不知道的是,我們在語音識别領網域做到行業領先。例如,小愛同學的語音識别是我們提供的,當時有10個語音服務提供商,我們的準确率排名第一;另外在2022年北京冬奧會機器人評測中,我們是得標最多的服務機器人企業。
這是我們畫的AI1.0的技術樹,從最早DNN、CNN/RNN,到後來的Attention、Transformer,所有行業内的公司認識到AI的巨大改變,于是一起在這棵樹上往上成長,順着谷歌指定的路線大家一起做。
其實在2016-2017年,大家對AI的判斷是它一出來就可以改變世界,當我們做好了視覺識别、語音識别,AI就可以理解語言,進一步實現自動駕駛,大家以為順着谷歌指引的路線就可以實現AGI。但事實上,在2018年、2019年這棵樹長不上去了,全行業難破瓶頸。
這時候出現一個分支,也就是GPT1、GPT2。在GPT2剛發布的時候,整個OpenAI就是硅谷的"笑話"。通過預測下一個詞就產生智能,這件事不靠譜,如果靠譜谷歌為什麼不做?
直到2022年11月30日 ChatGPT 橫空出世,李開復老師把ChatGPT的出現定義為AI2.0時代,這不是在原來的路線上長出來的,而是在分支中爆發出來的。
震驚世界的 ChatGPT,徹底開啓生產力革命。因為語言是計算機最難理解的事情,要知道人類是先有智能還是先有語言,這件事在學術界還沒有定論,但我們知道,語言在本質上構建了我們對整個世界的認知,對邏輯、推理的掌握,于是產生了智能。所以當ChatGPT可以通過不斷的語料學習,完成對語言的理解時,那麼離通用人工智能就不遠了。
其實回過頭看,ChatGPT 也是 Think Different 的產物,而OpenAI 在同樣的技術路線下也卷不過巨頭。
OpenAI最早做了四個項目,ChatGPT甚至是他們公司裏面最不看好的,其他三個項目得到的資源都比ChatGPT多。
ChatGPT的出現,改變了機器學習裏面非常重要的技術路線,以前我們認為讓計算機學會語言,就像我們學英語一樣,告訴它主語、謂語、賓語等語法規則,因為這是比較符合我們的認知,但只有OpenAI相信,由于Transformer的出現,使得計算機可以處理大量的數據,只要給它足夠多的文本,可以自然產生對語言的理解。
OpenAI 改變了機器學習語言的技術路線,從"學外語模式"變成了"學母語模式"。一旦對語言理解之後,就具備了推理和邏輯能力,產生了智能。
OpenAI,與其説是技術積累的成功,不如説是技術信仰的成功,更是 Think Different 的成功。還有一個比喻,ChatGPT的橫空出世更多像哥倫布航海,艦隊肯定牛,但也不是最牛的,而是因為他走了别人不敢走的路。
今天,幾乎所有偉大的創新公司,都是Think Different 的成果,如蘋果、特斯拉、OpenAI。但在最初,它們都是被質疑甚至被嘲笑的。比如,特斯拉剛出現的時候,所有的汽車工業沒有一個覺得埃隆·馬斯克可以把特斯拉做成,筆記型電池加四個輪子就可以造汽車嗎?直到Model 3的誕生。
當然Think Different也有很多失敗之處,這時候我們就要不停地思考、復盤,不停地在路徑當中不斷總結,不斷尋找那條路,如果一旦找到那條路,創新就屬于你。
AI大模型創新依然可以Think Different
回到ChatGPT,它是一次生產力革命,相信這已經是大家的共識。
人類歷史上可能只有蒸汽機的出現叫做生產力革命,蒸汽機出現後能量的轉化範式發生了變化。在蒸汽機出現之前,全球人均的GDP和生產力水平,在兩千多年的時間裏從未提高過,一直在低水平上,蒸汽機出現之後,人類生產力大幅度提高,工業文明開始。
而ChatGPT由于具備語言理解,產生了人類獨有的邏輯和推理能力。《人類簡史》裏説,之所以我們的祖先智人可以脱穎而出,就是因為講八卦的能力,人類進化了虛拟事物的能力,而虛拟事物的本質就是邏輯,沒看見的可以説出來,認為它存在,這就是一套邏輯系統,當這個邏輯系統被人類掌握後,人類才開始成為地球的主宰。
而ChatGPT由于理解邏輯和推理,使得今後電腦有可能實現智能的轉換範式。以前我們要做一個智能系統要上很多人、很多設施,成本非常高,而且不是邊際成本遞減,但是ChatGPT出現後,有可能一台電腦就可以像人一樣工作。
這一次的生產力變革,使得國家之間的智能競争不再是人口和教育數字,而是人口+教育+算力的競争,而每一家企業可能未來真正的智能水平也不只靠有經驗的員工,而是靠有經驗的人和很厲害的算力,這件事在硅谷已經出現了,有的企業已經會将一半的資金用在算力投資上。
今天這個時代,每個業務用大模型重做一遍,都能獲得十倍增長。有些企業已經開始崛起:
第一,微軟。2023年,老态龍鍾的科技巨頭微軟完全煥發了新的活力,我們在年初還讨論過,微軟有沒有可能成為地球上唯一一個市值超過10萬億美金的公司,這是真的有可能。微軟以前的Slogan是讓每一個家庭都有一台電腦,現在就可以變成讓每一個人都有很多AI助理,所以它整個的想象空間擴大了。
第二,我們知道Midjourney,現在年收入超過2億美金。如果只把它看成是一個玩圖的網站,那想象不到它的商業價值,但如果把它跟類似豬八戒網的網站對齊,它就是提供設計外包。以前企業要找無數的設計師滿足對圖片的需求,現在只要點幾下,就可以獲得需要的圖片,所以它的生產力大幅度提升。
第三,創業公司HeyGen,它就做了一個應用,把一個人的演講變成英語、日語,口形還能對準,現在年收入超過1800萬美金,供不應求。如果把它看成以前的視頻制作公司,幫你拍外語視頻,它的生產力也是極大提高。
第四,Pika也是最近硅谷很熱的一家視頻制作公司,只有4名員工,估值超2億美金。
面對這一次的AI大潮,每個人都躍躍欲試,但不知所措,總結起來就是兩句話:
第一,這一波技術來得太猛。很多人問我,以後是不是不懂技術、不會編程就要被淘汰,我們完全不懂AI到底是什麼。第二,變得太快了,剛學一些又有新的技術出現。
而我要説,這一波AI的到來絕對不是不懂技術的會被淘汰,而是給不懂技術的人一個非常強大的支撐。以後誰懂業務,誰懂計算機的行業規律,那誰就有可能被AI放大其能力,可能是十倍、百倍的放大。因為以前技術只屬于程式員,但今天不再如此,技術被平權化,擴散到千千萬萬個普通人,使得我們可以跨越這條鴻溝。
所以我想説,萬變不離其宗,所有的技術浪潮無論聽起來有多神奇,都應該躬身入局,以終為始,找一條适合自己的路。
記得我跟李彥宏的一次對話,他説每個月認知都在迭代,一方面在學習新東西,一方面很焦慮。在2023年3月份,國内千億大模型創業如火如荼,所有人都想要做中國的OpenAI。
當時我的團隊也找到我説,"老板,再不動手訓練大模型就落伍了,A100要大漲價了",他們堵在門口不讓我走,擔心這一波過去再做就來不及了。當時我抑制住了激動的心情,説等我想想。當然在他們的"脅迫"下還是買了一些A100,做一些基礎算力。因為從技術團隊的角度上,訓練千億大模型是技術皇冠上的明珠,每個技術團隊都有摘取的願景,但那時候我想的問題是如何才能有獨特的價值。
因為當時訓練千億大模型本質上是資本的投入,一次訓練要耗費上千萬美金,而且訓練一次要用3-6個月的周期,就像孫悟空在煉丹爐裏面,它不出來永遠不知道是什麼樣子,可能要等3-6個月才能看到這個模型怎麼樣,不行就要再來一次。那麼,做還是不做?
在千家萬户都在卷千億大模型的彼時,只有做千億大模型才是唯一路徑嗎?到了4月份,我跟出門問問的李志飛聊,他説不要做,因為再過半年中國會有很多個千億大模型,到時候會出現千億大模型過剩,但卻沒有應用。
我想起當時第一波做AI1.0的時候,招了很多博士,做的很多技術都可以發論文,但我要坦誠的説,第一代機器人做得并不好。後來我才換了一條道路,機器人需要什麼技術,就把那個AI技術打磨好,而不是先搞一堆技術放在那裏。
況且,如果沒有商業落地,那只是技術狂歡,脱離市場的技術投入,就是資源浪費。這個觀念今天講出來需要勇氣,因為天天大家都在講硬科技,但如果坦誠地看,在AI1.0時代,很多AI公司并沒有真正實現閉環,或者實現的閉環并不夠好,燒了很多錢并沒有獨到的東西,這是事實。
我想引用喬布斯的一句話:技術不是為工程師而生,而是為應用而生。
再回過頭來看,這波大模型的技術浪潮其實微軟是最笃定的,投資了OpenAI,将AI融入應用,把原來的Windows、Office加入Copilot,一個消息接着一個消息往外放,股價不斷上漲。
所以説,Think Different ,不是只有跟随 OpenAI 才能成功。
我之所以沒有走訓練千億級大模型的路子,是因為我在思考,不斷的拼資本、算力,拼到最後能用起來嗎?
這裏我總結了兩套大模型創新的模式。去年三四月份的時候,大家都覺得不做這個千億大模型上不了牌桌,做完了再去看哪裏能用。而我想這次要慢慢來,這次科技浪潮不是一年的事,甚至不是十年的事,我們要先從應用出發,挖掘應用場景,尋找垂直模型,到真正準備好了我們再開始訓練,我相信這麼一個大賽道下我們有的是機會。
我發現ChatGPT有用以後就在公司説,所有的部門都要參與到這次的AI變革當中,全員AI。通過搞内部創新的方式,湧現出一些特别驚人的例子。我們公司CFO的助理,從沒學過編程,用了ChatGPT以後,一言不合就開始寫程式,震驚了所有的程式員。
下面這張圖也是她畫的,她想表達的意思是,在垂直技術領網域,AI可能帶來生產力的躍遷,一個人可以通過AI賦能,從一個領網域的非專業人員快速達到中等專業水平,未來的很多崗位限制都會因為初階技能的消失而打通。
所以今天OpenAI是一個技術浪潮,但不是讓懂技術的人更牛,而是不懂技術的人能夠跨越技術的鴻溝。
通過近一年的實踐我們發現,大模型在企業增效中非常明顯,但是只靠員工自我驅動難以落實,一定要一把手親自抓,而且要深度結合企業流程進行AI重構。我們公司内部已經開始組織部門進行調整,成立了AI生產力部門,把過去散落在各地的中台部門全部統一到這個部門裏,并直接向我匯報。
總結起來就是,AI前景肯定很大,但現在還處于早期,大模型落地需要強應用。不把針對企業流程的應用做好,接入一個API就能夠讓企業增長20%的效率,是不可能的。只有進行流程重構,做好應用才有可能。
可能也有很多人知道,我吵架經常會上微博熱搜。有一次,朱嘯虎説,"AI大模型對創業者不友好,99%的能力都是被大模型覆蓋的,你們的創業公司有什麼價值?"我就很生氣,怼了一下説,"做好應用,依然是創業者最好的機會!"很多人以為我是一時興起,但是事實上不是的,因為在這之前我們實踐了太多,讓大模型回答好一個基本的問題都要做非常大的努力,需要做很多的套件才能真正實踐起來。
我就想起來兩句詩——紙上得來終覺淺,絕知此事要躬行。你只看朋友圈就覺得AI要吞噬人類,未來全人類只需要一家公司就是OpenAI,但是事實上你真正動手做發現太多的細節是可以去做的,魔鬼都在細節裏,如果只要一個底層技術很牛就能做出一切,芯片公司将來會統領所有行業。但是并不是這樣的,底層技術有底層技術的價值,應用有應用的價值。
我們在去年三四月份就和客户一起成長,在2023年5月,有客户説能不能幫我私有化部署大模型。但是當時一個千億參數大模型一年私有化授權費用是幾千萬,到今天應該還是,然後,你買伺服器的費用最低成本160萬(當時的價格)。我們客户説,我們其實就想做一個客服,AI大模型被講的那麼牛,我一年投個幾千萬難以承受,再高深的技術最後得算賬,我不能因為有這個技術就用,用了以後比我現在的成本高幾十倍,有沒有更便宜又不損失性能的方案?
這個時候行業又發生了變化,LLaMa來了。LLaMa在行業内有一個綽号叫做"奶媽",因為它滋養了很多大模型公司,使得大模型的算法壁壘快速消失。開源社區本來就是人類文明的一部分,我們可以看到這棵科技樹在OpenAI的旁邊又長出了一個分支。
有人説OpenAI都在搞幾千萬卡的并聯了,但是有一幫科學家、從業者、技術極客説千億參數可以湧現智能,百億參數可不可以呢?百億參數的智能在有一些情況可不可用呢?所以在LLaMa出現以後,整個開源社區開始百花齊放,小參數模型的性能快速崛起。
我們可以看到在有一些評測上,百億參數模型在某一些能力上已經接近了GPT,我覺得這就是這個行業每天都在日新月異的發展給我們帶來的機會。我們突然發現也許千億參數不是唯一的選擇,這個分支帶來了AI大模型的二元對立時代。
我當時在一個演講中説,有經濟實力的公司全在卷算力,他們的夢想是造出一個愛因斯坦。同時還有一幫開源社區的極客愛好者,用更小的資源、更精巧的算法去實現智能,看誰能造出平民化大模型,每個人都可以随便用,而不是一上來就要幾千萬門檻的大模型。當然,由此我們也能看到,所有的技術并不是在一個樹上從頭長到尾,而是會不斷湧現出新的分支,可能有一天一個分支就會變成主流。
在我們自己的實踐中,我們就給客户做調試,後來發現用百億參數的模型,加上客户自己的私有數據,再加應用的打磨,效果是可以約等于甚至大于千億參數大模型。
雖然千億參數大模型必然全面性更好,比如讓它做一道奧數題,回答法律知識,它的面會很寬,但是在企業場景當中并不需要做奧數題,只要在一個專業點上做好就可以了。所以不同專業的應用領網域,用一個百億參數把數據打磨好,把應用做好,它就可以滿足需求,而且更具性價比。
這有一個非常真實的案例。今年四五月份的時候,我們用千億大模型的參數沒有做深入調試,結果只有60%的準确率,相信很多從業者一定也會有這樣的體驗,聽起來很好,但用的時候有很多問題。我們用了6個月的時間,與前面提到的那個客户一點點打磨,做到了97%的準确率,基本上完成對這個場景的增強。
所以我們想説,我們自己也在實踐,企業應用百億參數就夠了。
企業應用AI的三段位理論
AI在企業内部到底能做什麼?很多朋友跟我説,用了之後感覺企業不太能用起來。
在闡述這個問題前我講一下什麼是AIGC。AIGC就是AI生成内容,但如果把這個過程放大來看,AI由數據訓練出來,如果只是基于互聯網、出版品等公有數據,那麼AI對整個知識的了解就是大家的常識,當你給它一個問題,那就可以產生内容(C1),但這種回答都是正确無用的,因為很表層。如果可以結合企業的私有數據,那就可以產生專業知識的内容(C2)。如果可以根據私有數據再配合強應用+套件,那就可以實現企業經營決策的全流程(C3)。
我把企業用AI總結成三個段位:
第一,青銅段位,基于公有數據,使用AI和Prompt,生成一些宣傳文檔或圖片。
第二,黃金段位,基于專崗私有數據,例如公司的行政文檔、員工守則、業務标準,把它灌到大模型裏,這就是今天被行業内廣泛提的"數字員工"。
第三,王者段位,企業全過程的經營數據由AI參與,使得AI可以直接提供經營決策,比如今天該不該發布一個產品,哪些費用可以被減少,哪一個地方的工作重點需要加強。因為企業最大的成本不是用工成本,而是經營錯誤的成本,是對經營不夠了解導致決策失誤的成本,所以企業要想真正用好AI,應該是全流程、全數據化,可以理解企業各種經營細節的"數字老板",幫你提出經營決策建議,這件事情必須做到真正的流程重構。
OpenAI的"陽謀"
在展開前,調侃一下OpenAI的"陽謀"。大致意思是,你知道這件事可能對你不太好,但卻拒絕不了。比如,兩千多年前漢武帝想要削藩,但是諸侯勢力太大,如果直接誅殺勢必會引發造反,于是,出現了一個千古陽謀——推恩令。它規定諸侯的土地平均繼承給兒子,有幾個兒子便分為幾份,這導致諸侯每一代得到的軍隊和土地逐漸變少,最後甚至完全消失了。這便是"陽謀"。
OpenAI幾乎把互聯網上所有公開出版的數據都讀取了,但人類的知識體系無比巨大,互聯網再浩瀚也只是人類知識體系的冰山一角,甚至還有很多文檔沒有公開出版。比如我們每次開會讨論作出的決策,背後有幾十人、幾百人組成的觀點系統OpenAI是沒有的,所以OpenAI推出了GPT Store。開發者通過它可以很快構建自己的應用,使得OpenAI從以前通過互聯網抓取數據變成GPT Store,在内生的平台上產生數據。通過GPT Store,很多決策數據被呈現和記錄下來。
調侃一下,都説Apple Store是交"蘋果税",GPT Store是交"智商税",因為大模型可以學習,真正地把數據變成自己的内容。
如果一家公司要實現經營數據的全流程AI化,只靠合同、财務……短期内可以提高效率。如果我們沒有使用ChatGPT,相當于在幫自己的競争對手,甚至有可能使得ChatGPT具備你的能力,某天你的企業就變成了它的一個API接口。這件事正在發生:
GPT Store發布的時候,一位硅谷創業者説,Altman給了500美金的OpenAI優惠券,但是毀了300萬美金的創業公司。因為它把創業者做的事給做了。
Altman還在一次采訪中表示,以後95%的人都不用工作,5%的人工作就可以創造足夠多的财富,讓所有人幸福生活。
最初我也有恐懼,但今天發現不需要。剛才講的科技樹,在大型的千億通用模型邊上又開始出現百億參數模型,甚至最近還出了幾個幾十億參數的模型。這個發展趨勢讓我預判:以後每個人都有自己的貼身助理。
所以,企業要有持續的競争力,就應該使用私有化大模型,讓經營數據内循環,讓企業過去留在每個人腦海的經驗變成整個決策智能的一部分。我們可以期待AI助手幫我們判斷新產品的市場潛力,挖掘市場上的機會,監管員工的工作,計算每天工作的有用率等等,而這,正是我們可以期待的未來。
獵户星空大模型:為企業應用而生
七年磨一劍。我們在AI行業投入了很長時間,現在已經打造出了頂級的團隊。經過各種算法的嘗試、多種伺服器的使用和多種大模型的訓練,共同打磨出我們的五個優勢部分:頂級團隊、算法理解、場景認知、應用打磨和數據累積。
獵户星空訓練了140億參數的大模型,在企業應用的專業場景中可以實現千億參數的效果。在發布大模型基座的時候,我們做了7個應用方向的微調,在很多榜單上名列前茅,很多用户也都説我們調得不錯。
評判一個模型的應用是否調得好,需要在方向上積累非常專業且高質量的數據,我們做到的同時還提供"千元顯卡即可運行"的目标。讓人驕傲的是,我們也做到了,所以擔得起這三個詞組的評價:用得好、用得起、用得安心。
我們經常可以看到,有些大模型在榜單上靠前,但用起來卻很一般。這是為什麼?
因為可以對大模型進行"應試教育",從而在榜單上刷出很高的分數。但我跟團隊説,不能為了分數就去進行"應試訓練",所以獵户星空發布了"素質教育版"。在這個版本裏,我們不刷題,保證它遇到沒有見過的新問題時,水平是一致的。
再來看素質教育版本的基座能力,在200億參數以下,我們在所有大模型的評測體系上的分數都很高,這代表了較強的基座能力,也意味着犯錯的幾率會很小。
在綜合評測機構OpenCompass的測試中,我們比720億的千問得分略差一點,但700億以下的範圍内,我們的得分都是最高的。這标志着我們發布的大模型的基座能力能夠在企業應用當中替掉很多三四百億參數模型。何為參數?可以簡單理解成網絡復雜度,百億參數模型比千億參數可以省出90%以上的私有化部署成本。
另外,獵户星空可以支持320K的Tokens,一個Token相當于1-2個漢字,可以一次性讀取50萬字的文檔。經過我們的實測,對30萬字的文檔裏的任何一句話進行提問,它全部可以回答出來。最早的時候大概只能支持千字量級的文檔,文檔過長的話,需要做大量的匹配工作。而現在,相當于一本幾十萬字的偵探小説,讓它讀完之後,問它殺手是誰,它立馬能回答出來。
可以説,這是非常厲害的特性,量化性能的損失低于1%。把它的模型縮小到原來的幾分之一大小,它依然能夠實現原來模型99%的性能,我們把這叫作"減脂不減肌,無損壓縮"。模型大小降低70%,推理速度卻提高30%,這意味可以用非常便宜的顯卡運作起來。我之所以説企業的私有化大模型時代到來了,正是因為伺服器成本和運營成本會降到可以忽略不計的地步。
除了以上的優勢,我們還加入了日、韓語能力測評。
以前我們做服務機器人的時候,每進到一個餐廳就得做适配,這讓我們很苦惱。以前,在海外銷售的服務機器人不具備多語言能力,很多可能性被鉗制住了,現在有了大模型,日語、韓語可以做到很好的交流,能夠進一步擴寬市場。
在評測指标上,今天發的140億參數的獵户星空大模型是所有200億參數以下各項評測性能最好的,但是跟GPT的全面性仍然有一定差距。不過,通過各企業應用定義好垂直場景,通過數據和應用的打磨,我們已經實踐出在應用場景上超越GPT-4的可能性,這不是妄想。
下一個裏程碑
我們今天發布這個大模型之後,下一步準備怎麼做?
最近業内開始出現一個叫MoE的構架。所謂MoE構架,是用多個模型進行集體決策,完成對一件事情的判斷。今天在業内發的論文裏,8個百億參數模型的聯合運行,其性能的某些指标已經超過了GPT3.5。相當于很多火箭都在打造一個更大更強的發動機,SpaceX做了一個核心的發動機,綁成9個就是獵鷹9号,綁成27個就是獵鷹重型,它用一個極簡的可復制的構架完成了最大載送量的火箭,而不是去從頭造一個特别獨一無二的發動機。獵户星空正在做同樣的事情,專注在百億參數模型的性能提優,保證通過新的構架完成基礎能力的不斷提升。
為了讓企業更好地應用,我們獨家推出微調全家桶。微調指一個基座只有技術人員可以使用,這個時候就要有一個微調方向,去解決這個問題。我們做了一個聊天的微調大概用了15萬條高質量的數據,有的是發完了以後再做的微調,有的時候是自帶的插件微調。
大模型要和傳統的程式有一個接口,這個接口調用一個插件,我們也針對插件做微調。除此之外還有專業問答,通過微調進行大海撈針,之後生成。
這些方向基本上都是我們通過不斷實踐、和客户摸索出來的。微調只是相對大模型的預訓練為"微調",但是工作量并不小,而且哪個數據能夠讓大模型表現更好,都是一點一點打磨出來的。
在七個微調方向裏,我們重點打磨的兩大方向為RAG和Agent。這是今天AI大模型浪潮裏非常重要的兩個方向。
RAG即專業知識問答,它更學術化的名稱為"檢索增強生成"。比如,當你問大模型:"為什麼周鴻祎先生要穿紅色衣服?"如果沒有做RAG的檢索增強,他可能就會説:"因為可能他喜歡紅色"。我們看過各種原因,包括"他喜歡紅色"、"紅色是他的吉祥色""今年是他的本命年"等等,這些結論是它根據泛知識做的大致推理。而做了檢索增強以後,它會根據背景信息去重新生成檢索,給你一個正确的回答:因為他的名字經常被人讀成"周鴻偉",他穿紅衣是為了提醒别人他是"鴻祎"。這個回答他曾在幾次演講當中説過,但是不一定是互聯網上的公開數據集,因此如果沒有檢索增強,就很容易出錯。
RAG被很多行業人反復提及,并且有了專業術語。但是真實的情況是,如果你不深入做,雖然很快可以給别人Demo,但是半年都用不好,因為将準确率把控好非常困難。
今天開源社區有很多RAG套件,基本上往上一套之後再把文檔一換就可以回答了,但是這個回答往往準确率不夠高,而我們這次推出RAG套件是一系列的組合,能夠保證極高的準确率。我們在内部做了一輪評測,準确率遠遠高于對手,這不是大模型基座單一的能力,而是與RAG套件統一合作完成的。
有一個概念叫"數字員工"。但是,目前的數字員工能力很低,基本上就只能對文檔給出提示。要想真正地将企業應用與專業知識深度融合,做到和人一樣準确的回答,需要RAG套件。
Agent是硅谷今年特别火的方向。它幫助大模型實現人類的記憶、行為規劃等等一系列的事情。Agent用得最多的場景是和傳統的系統接口之間調一個打開接口。
這件事聽起來很簡單,但是并不容易。因為大模型常常回答不穩定,如果不做足夠多的微調,問它同一個問題就會出現不固定的答案,或者難以從一句話裏找出關鍵點。
在Agent所需要的五種能力中,獵户星空大模型均接近GPT-4的水平,其中包括:意圖識别成功率90.3%、首輪抽參成功率100%、多輪抽參成功率90%、缺槽反問成功率91%、插件調用成功率91%。
雖然我不是很懂專業領網域,但是我知道這些很重要。因為要保證大模型跟你的系統接口不出錯,保證大模型能夠穩定運行,就需要套指标。我們評測過很多同等參數量的模型,能夠超過70%都很難。比如我問:"北京今天天氣怎麼樣?"它得知道你問的是天氣,還是北京的天氣,而且每次保證足夠的穩定。我們最近想要把我們的經營數據和大模型打通,這套工作程式非常復雜,但是能夠穩定輸出,因此需要試一試。
綜上所述,要先把RAG和Agent兩個套件用好,企業數字員工才能夠落地。否則用一些公開接口、一套開源數據庫、開源向量數據庫或構架去提升準确率的話,完全沒法應用。
實現企業應用AI的王者段位,打造"數字老板"
我們這次發布的140億參數大模型,完全開源免費,還可商用。之後,我們還會成立免費的社區支持群,将微調應用方向開源,以此希望促進大模型行業不再只是技術狂歡,而能夠真正落地,我們甚至期待更好的技術大模型的出現。獵户星空百億參數大模型,我們認為它是企業标配的首選,值得企業們為我們駐足。
通過以上的講解可以看出,我們的產品差不多算是達到黃金段位了,但是還未登頂王者段位。不過,我們正在走向王者的路。
真正要實現王者段位,就要讓AI要和企業的經營數據全綁定,一步一步深入,為企業提供決策支持。我們當時提出了一個叫AI基地的概念,AI產生決策,而不是内容,一個企業要真正到達王者段位,需要AI輔助決策。
為此,我們推出了一個強應用套件——聚言。聚言專門用作咨詢服務,當企業或員工遇到難題時,它可以教課、做培訓,它幫助企業老板提高決策效率,增加企業決策準确度,是一種真正意義上的"數字老板"。
我們做了三個重點的強應用,在這幾個強應用上還提供保姆式的服務,真正通過應用+調試+流程整合一條龍服務,全程幫用户進行落地。我們專門參考傳統咨詢公司的做法,提供的服務包括從業務流程如何組織體系改造,到方案設計、大模型的選型、實施、培訓等。我們提出交鑰匙解決方案,保證AI的應用效率可以做到行業領先。
雖説基礎模型和模型工具大家都有,但在今天再回頭看,跟着應用一起生長出的幾個套件才應該是真正的重點,而這套解決方案是跟客户一起打磨出來的,不是在辦公室裏想出來的。
其實,AI不是一把手推動,就沒有辦法真正推下去。而AI真正的提效不在于數字員工,而是老板,老板的效率高那麼整個公司就活了。
傑克·韋爾奇説:"老板是最後一個知道公司要倒閉的人。"其因為很多經營的細節是散落在很多地方,只能通過一個個人的匯報了解總體情況,而且聽匯報的效率和精力都是有限的。
接下來,我有三個問題問老板們:
一、如果你是企業的一把手,你真得聽得到一線的呼聲嗎?
HR一直是很難數字化的部門,因為在大模型出現前,每個人的工作都通過文字表達,所以過去的系統很難真正做到對員工工作狀态有足夠了解。
我想很多老板對一線員工的理解往往停留在他們是否繁忙、是否辛苦的層面,卻并不知道他們在忙什麼。常常出現的情況是,整個公司都在做戰略項目,一線卻少有人做。當我們在策劃這個產品的時候就想要幫助老板解決這個難題,真正幫企業提效,找到AI比人擅長的地方,而不是簡單替代人。
AI真正比人擅長的地方是可以讀數千份文檔,做出歸納總結,它的廣度和精力一定比人強,它做出基本的推理一定能夠起到決策支持的作用。
二、你知道公司的雲成本花到哪裏了嗎?
獵豹移動出海是當時亞馬遜在海外最大的中國客户,我們很早就對亞馬遜在全球的部署深度參與,當我們的海外業務遇到阻礙的時候,把整個雲的運維隊伍分拆出來成了一家公司,幫助各個中小企業和出海企業上亞馬遜雲和谷歌雲,僅就這一個業務,它的復雜讓我自嘆才疏學淺。後來才發現這是一群極其深度的工程師,他們的語言對外幾乎無法交流,CEO不懂雲,CIO不敢得罪CTO,業務部門總是申請更多的雲資源,但很多時候都不怎麼用,CIO又不了解業務的細節,所以雲就變成閒置資產。正是為了避免這樣的事情再次發生,我們在上面開發了針對這項功能。
三、是否為新營銷策略而苦惱?
今天的一份咨詢報告十分昂貴,如果找ChatGPT解決需求,雖然他的回答聽起來有用,但實用價值并不高,為此,我們構建了幾個Agent互相讨論的工具,可以給出一些有價值的營銷策略。
聚言聚齊了我們考慮的各個方面,希望成為老板真正的決策助手,讓AI進入全流程和經營決策,并跟随客户一起生長,在未來越來越有實用價值。
2024年預測
接下來,我想對2024年AI做三點預測:
第一,千億大模型真正使用起來很少。
在這一輪大模型競争中,千億大模型并不需要那麼多,但私有化百億大模型會百花盛開,相信更多的企業會部署私有化的百億大模型,真正幫助企業經營提效。
第二,超越OpenAI的機會來自應用創業公司。
今天很多朋友去美國看回來跟我們説,這一波AI的應用創業硅谷實在太火了。回想Web時代的互聯網創業,中國可能和美國是1:1的比例,但是這一波AI創業硅谷至少是我們的好幾倍。硅谷已經有了AI應用一條街,那條街上全由AI創業公司組成,他們将大模型的能力和實際運用相結合,讓AI參與到生活中。
第三,數字老板是成功企業的标配。
以後董事會考核CEO使用AI的時長,如果一個CEO用AI用得少,那就意味着他一定會落後于這個時代。
講完所有内容之後,讓我們做一下總結:
首先,我認為科技創新的核心是Think Different,在原來的路徑上或許你可以做得更好,但是你的對手也可以做得更好。我們今天看到的科技爆炸不是一條通天的登天梯,而是不斷的豎狀結構。當這條路被别人占領的時候,你就可以想另一條路,也許就能實現新的創新。
當你在一條路上卷不過别人的時候,可以構思出另一條路,這條路也許也能讓你抵達目的地。這就是科技史上一次又一次的Think Different,成就了一次又一次的創新,我們都親眼見證過成功的案例,所以并非只有一條路才能成功,每一個科技創業者都應該去找到不同的道路實現差異化的創新。
另外,我們在業内首提企業應用AI的三個段位理論:從青銅到黃金,再到王者。
接一個API讓員工用大模型只是青銅段位;能夠深度的使用RAG套件、私有數據相結合、實現數字員工是黃金段位;第三個段位則是企業經營全流程AI化,實現AI的輔助決策,幫助企業提高決策效率和企業準确率。
而我們獵户星空大模型,正是希望各位企業成為AI應用的王者。同時,也提醒大家,創新道路千萬條,不是只有OpenAI這一條。
最後我想説,今天能夠站在這裏我感到非常激動,因為這是有史以來我準備的最充分的一次演講,這個PPT我打磨的至少五六版。今年講七年磨一劍,實際上是七年時間都在探索,雖然我看似自信地説意識超前,但是説出口的瞬間背負了很大的壓力。
2016年,當我喊出應用AI的時候,很多人問我幹嘛不去做電動車。但我生來倔強且堅持,既然選擇了就決定一路往前。我一直熱愛AI領網域,中間有很多人質疑我的選擇,我從選擇的那一天起就決定不要輕易放棄。但是,創新是很孤獨的路,我相信你們大家也有過心碎、焦慮的時刻。
我既然做了AI這件事情就要保持對他的熱愛,無論是To C還是To B,我是一個做產品的人,就應該熱愛產品、熱愛應用,只要有熱愛,我相信我就能在創新的道路上一點一點的摸索出自己的道路。
Think Different看上去很容易,實際卻很難,失敗的風險也很高。
我們看到的創新成功案例,是無數個創新者、創業者在不斷尋找方法,前仆後繼失敗的人之後冒出的那幾個人。我們不一定可以成為最終冒出頭的人,但是要做一往無前的人,因為每一份的努力都有意義。