今天小編分享的教育經驗:章鵬:大模型只是少數人的機會,小模型才是大多數人的機會,歡迎閱讀。
" 現如今在矽谷進行融資,如果你的業務與 AI 全然無關,投資人根本就不會理你。"
" 訓練一次 ChatGPT 的價格及其昂貴,大約為 1200 萬美金。之所以花費如此之高,首先是因為人才的緊缺——據說,全球能夠訓練大模型的技術人員,目前不超過 100 位。"
" 大模型創新一般是一些美國的大公司,這些公司之間幾乎已經形成了壁壘,所以對于創業者來說根本看不到機會。" 北京神州飛思信息科技有限公司創始人章鵬說。
AI 帶來驚喜的同時,也伴随着一種越來越強烈的恐慌:人類是否正逐漸淪為無體力價值、無腦力價值、無情感價值的無用階層?既然對于創業和擇業人員來說,AI 是無法繞過的課題,那我們只有接受現實,及時考慮在此趨勢下的創業機會、發展路徑。
但是,AI 大模型下的創業機會到底是什麼?中小企業如何借助這波 AI 的東風?
前不久,混沌創新院 23 級 1 班學員章鵬作客混沌直播間,帶來混沌創新院 AI 系列直播欄目第三期内容。他從 AI 的第一性原理為起點,為我們講解 AI 的底層邏輯、AI 的創業機會和中美在 AI 領網域還存在的差異。
以下内容來自直播:
分享嘉賓 | 章鵬 混沌創新院 17 級、23 級同學 北京神州飛思信息科技有限公司創始人
在網上,最近總是出現一些 "AI 正在覺醒,人類即将成為奴隸 " 的言論。這樣的消息難免會讓人產生焦慮,至于為何會引發廣泛的焦慮,接下來我想要詳細分析一下。
三年前,OPenAI 的創始人薩姆 · 奧特曼做了一個名為 WorldCoin 的項目。當時,ChatGPT 橫空出世,很多人擔憂它的存在會取代人類,于是 OpenAI 決定啟動這個工程,讓 AI 的勞動創造的财務通過區塊鏈的形式空投給一些沒有工作的人。到目前為止,該項目已有 170 萬用戶注冊,為了保證注冊人為真實存在的人,OpenAI 特意設定為眼球虹膜注冊的形式。到今天,WorldCoin 的融資金額已達 1 億美金,最近一輪的融資估值為 30 億美金。
在中國學術界,清華大學元宇宙實驗室的沈教授與薩姆 · 奧特曼秉持着同一觀點:自然人逐漸淪為無體力、無價值、無情感的無用階層。
這個話對我的震動很大,同時我對此感到懷疑,但轉念一想,AI 行業裡的領軍人物有這樣的觀點,應該自有幾分道理。所以我開始思考 " 人類的未來是 AIGC",就算不是百分之百的概率,也是極大的概念。
立足于這份焦慮情緒,這次我的講解會分為三個章節。分别為 "AI 大模型的邏輯 "、"AI 大模型下的創業邏輯 " 和 " 中美 AIGC 賺錢機會的差異 "。
AI 大模型的邏輯
首先表明我的結論:AI 大模型的底層邏輯是一個數據概率的邏輯。RLHF ( Reinforcement Learning from Human Feedback ) 讓大模型更擅長與人溝通了。
在 1956 的的達特茅斯會議上,"AI" 這個概念首次被提出。此後,AI 經歷了幾次高高低低的發展,以前的算力和數據比較落後,現在幾乎已經走向成熟,湧現出巨大的能力。正如 OpenAI 所言,作為開發者,現在 ChatGPT 也已經遠遠超出了他們的預期。
以前,神經網絡領網域也曾致力于發展 AI,制作出類似 AlphaGo 這種人工智能,但遠未達到 ChatGPT 這代 AI 的理解能力。
現在的 AI 大模型它可以像人類一樣思考嗎?我想,如果把人類比作老鷹,AI 就是飛機。其實,AI 能做到現在這個程度是通過算力達到的,它的思考只是超大數據概率的延伸,無法做到像人一樣思考。大模型只是把整個互聯網裡所有的數據知識學習了一遍,它吸收知識和運用知識的方式與人類完全不同。
如果不太恰當地把 AI 的參數與人類的神經元等同起來的話,ChatGPT3.5 集結了兩千億個參數,而人類的神經元卻有百萬億。根據 ChatGPT 的數據來看,它們大概能理解十億字,而人一生大概學習 1 億字。當然,AI 和人都需要不斷發展,ChatGPT 靠算力靠訓練和電力,人類靠學習溝通和食物。
訓練一次 ChatGPT 的價格及其昂貴,大約為 1200 萬美金。之所以花費如此之高,首先是因為人才的緊缺——據說,全球能夠訓練大模型的技術人員,目前不超過 100 位。訓練 ChatGPT 類似于煉丹,需要用大數據不斷地修煉,并得加入一些調優的算法和算力,然後,經過漫長的等待後才能算完成。在這個過程中,确認爐子裡的東西被煉到哪種程度的人員就是工程師,他們每訓練一次就會出現新的算法。
這些工程師的厲害之處在于不需要等待大模型訓練完畢後才能發現它的問題。如果工程師發現了大模型出現了一些偏差,可以先把它停掉,在調優後重新進行訓練,直到确定它訓練的方向是合理的。
從一開始,OpenAI 定位的并不是一個商業項目,而是一個開源組織。從中我們可以看到,大模型的發展需要持續不斷迭代和嘗試,大模型的底層核心邏輯是大數據的算法湧現。
AI 是大勢所趨是業内公認的。在矽谷進行融資,如果你的業務與 AI 全然無關,投資人根本就不會理你。未來,幾乎所有的行業都是在大模型的基礎之上運行和發展的。我們可以将它理解為下一代的作業系統。
此前,美國三院院士在内的 100 多位學者聯合發表長達 160 頁的文章,文章提出,超大規模預訓練模型将是實現 " 通用人工智能 " 的基礎模型。包括 ChatGPT、Gato、DALLE 等在内的大模型也在努力逐步接通。或許,這個作業系統會每兩年迭代一次,然後逐步完善,但是未來的互聯網或者說整個世界都會建立在大模型的基石之上。它們就像日常生活裡的水和電。
我問過 ChatGPT,大模型人工智能的第一性原理是什麼?
它回答道:" 是通過數據和計算能力進行端到端學習,無需顯式設計特征。它依賴于大規模訓練數據和強大計算資源,通過自适應學習提取模式和規律。核心思想包括數據驅動、端到端學習。可拓展性和自适應性。這一原理推動了人工智能的突破,但無需考慮資源使用和倫理問題。"
之後我又問它,它不能做什麼?
它列出了一些無法做到的事情。其中大概包括 " 不能推理和邏輯判斷 "、" 不能長期記憶和持續學習 "、" 不具備真正的情感 "、" 不能進行道德和倫理的判斷 " 等。
在未來,ChatGPT 提到的局限之處會一一得到解決,但是在情感和道德的能力可能仍然無法解決。
綜合上述内容,我們可以總結一下大模型的底層邏輯:
1、大模型人工智能是用數據喂大的,能力取決于計算能力和算法。
2、大模型人工智能更好地解決類似編程這種高度确定性的任務。
3、大模型生成圖片的創造性是組合創新,不是發明創新。
4、大模型沒有創造性思維,不會由一個蘋果想到萬有引力,所以它無法成為下一個 " 牛頓 "。
以上幾點總結只是一些代表性的内容,并不完全。另外我還想強調的一點是,從當前的技術邊界來看,我們大致可以推導出大模型的能力,但技術的變化往往是超出人的預期的, 所以下一代模型是什麼樣子,我無法告訴你答案。
AI 大模型下的創業機會
在此,我想先列出幾個個人觀點:
第一點,目前人類和機器的互動方式是螢幕模式,未來可能會逐步轉為對話模式。人際交流的對話模式在科技領網域會是一個很大的突破。
第二點,有核心私密數據的行業可以訓練小模型。AI 的大變革對于很多行業來說是有利可圖的,各個行業都有自己的核心秘密數據,AI 的存在可以加固這些數據的安全度。只要這些秘密數據不洩露,就可以使得他們的業務範圍更廣、效率更高。
第三點,Agent 是大模型作業系統上的核心應用。因為 Agent 是一個可信賴的服務,比如說以往我們會在美團上訂餐,而現在我們可能就需要用來訂餐的小模型,你告訴它你想定的食物後,它便會把食物送到你手裡。這個過程可以視為小模型能夠獨立完成的事情,而大模型卻做不到。
第四點,AI 和區塊鏈的關系是生產力和生產關系之間的關系。其實,不管是制作何種類型的大模型公司,都非常重視區塊鏈。區塊鏈與 AI 看似是互斥的關系,一個是極度中心化,一個是去中心,但是兩者在 Agent 的模型之下是一個絕妙組合。
第五點,我認為 AR 時代即将到來。一旦我們進入到 AR 時代,大模型将會成為它的基石,同時反向影響大模型的發展。因為 AR 本就基于各種語言模型的理解才能完成與作業系統的對話,所以它的發展對 AI 的發展的影響是顯而易見的。
接下來,我們一起來看看 AIGC 的產業圖譜。
最下面的算力層幾乎被英偉達、高通等公司壟斷了。因此,這一塊幾乎沒有什麼機會,所以為了穩妥起見,創業的方向需要避開這一塊。
模型層一般是一些美國的大公司在創建,這些公司之間幾乎已經形成了閉環,所以對于創業者來說根本看不到機會。
再往上是我們需要重點關注的功能層。這一層有很多種類和方向,比較矚目的是文本生產、音頻生成、影像生成和視頻生成。美國的創業公司們一般都在功能層探索新大陸,如果有很妙的點子和過硬的技術,這一層對我們來說也會存在着一些可以攻略的領地。
還有就是應用層和場景層。應用層包括文本分析、問答系統、視頻和音頻系統等領網域;場景層是 AIGC 與不同行業的結合,包括醫療、教育、娛樂、金融等。
在我看來,AI 可以實現全行業提效。我身邊從事不同行業的朋友都向我反應過,用 AI 辦公可以明顯提升工作效率。比如宣傳文案、方案策劃等工作内容,AI 會是一個絕好的工作夥伴。但同時我也發現,雖然用 AI 工作的人有很多,但是并沒有人深耕這一塊,也沒有人投身到這一行。由此可見,目前國内市場在這一塊還有缺口。
從公司象限的角度來看,不管是 To C 還是 To B 領網域,也不管是陪伴還是產生效率,每個象限裡都有一定機會。在此我重點提一下 SAAS 行業,未來它一定會有供大量人才大展拳腳的空間,比如 Adobe 公司的新產品 Firefly,該產品與 Photoshop 進行了結合,還延伸出一些工具可以讓用戶更方便地制作圖片、海報和插畫。
另外,制作虛拟人陪伴類產品的公司有很多,Character AI 是其中的代表。在單身率逐年上升的當下,年輕人的孤獨感也與日俱增,虛拟人陪伴類的產品有很大的市場潛力。前段時間,美國有位女明星把自己的 AI 分身按照分鍾時間售賣出去,獲得了很高的銷售額。越來越多的人投入到了這個領網域,在未來會成為一個更廣闊的市場。
通過這兩個例子,我想說明大模型只是少數人的機會,小模型才是大多數人的機會。那麼,在未來,大模型 + 小模型的模式将會是主流。
可以看來,前不久 ChatGPT 開放了一些插件。日常生活中的一些需求都可以通過這些小插件完成。目前來說,它的體驗效果有待更新,但卻可以看出之後 AI 發展的一個趨勢:大模型之上的小插件可以幫助人類解決各方面的問題。
這些插件看似很小,但收入驚人。我們可以看一個例子:Monica 是 Google 上的一個小插件,它可以幫助用戶撰寫文案,也可以用作智能搜索。根據 Google 的官方數據,該插件目前約有 60 萬名用戶,每位用戶每月收取 8.3 美元的費用,一年大概收入 6000 萬美金左右。但其實這個插件的技術含量并不高,制作團隊一共才 11 人。由此可見,這種基于大模型之上的小模型其實有無限可能,因此我認為未來如果有機會湧現的話,一般都是小模型。因為它定位很明确,能夠很直接地幫用戶處理難題。
所以,如果有小模型能夠在某一特定專業裡做到極致,将是巨大的機會。
講到這裡,我生出一個思考:如果未來的人機互動不再需要螢幕,那一定是基于大模型之上的。
這個思考源于人機互動的核心在于人把信息傳遞給機器,機器再通過大模型進行信息翻譯,最後把它給到的信息傳遞給人。
這樣的互動方式相比螢幕來說,更簡單、更便捷。因此,如果 AI 勢不可擋地發展下去,那這種人機互動的方式将成為主流。而這,也宣告了 AR 時代的到來。
在此我簡單解釋一下 VR 和 AR 的區别。VR 需要以一個眼鏡為介質,戴上眼鏡之後,人類就會處在一個虛拟世界裡,你可以身在家裡,但視野之内是馬爾代夫的風景。AR 眼鏡起到的作用是增強現實, 是一種實時地計算攝影機影像的位置及角度并加上相應影像、視頻、3D 模型的技術,這種技術的目标是在螢幕上把虛拟世界套在現實世界并進行互動。是把原本在現實世界的一定時間空間範圍内很難體驗到的實體信息 ( 視覺信息、聲音、味道、觸覺等 ) 通過電腦等科學技術,模拟仿真後再疊加。
AR 眼鏡架設在大模型之上,但是目前它的開發成本極高。因此,要進入 AR 時代之前,大模型得成為普遍。
提到 AR,繞不開 " 數字人 " 的概念。數字人集合了多種多樣的模型,能夠替代真人完成許多真人完成不了的任務,諸如宇宙失重地區、高寒缺氧地區和不便長期居留地區。它在外形上與人類真假難辨,正如薩姆 · 奧特曼所說的:" 需要用眼睛的虹膜驗證數字人和現實的人 "。
數字人之後,則會出現 " 數字生命 "。這個技術可通過網頁獲得形象自助生成、AI 對話等定制型服務。
今年年初,一位年輕人想念奶奶,于是他把奶奶的語音、數據、影像等内容傳達網上之後,做成了一個小視頻,引發廣泛讨論。從這件事情裡我們可以預見到未來的一角,這個小視頻可以說正是數字生命的早期版本。所以,未來應該會有一些機會體現在這個領網域,比如剛剛所講的祖先虛拟人,這個技術可以幫助一些人緩解親人離世的悲傷,且有很強的情感内核。
總結一下這部分的内容,大概有以下幾點:
1、ChatGPT 能夠幫助大部分行業提高工作效率。
2、模型即產品,小模型(插件)目前是一個新的創業方向。
3、由于互動模式的變化,可能會颠覆 APP 的形式。
4、由于 AR 的出現,會出現新的產業機會。
5、大模型就是下一代的超級計算機。
6、AI 的價值交換體系可能會搭載在某條區塊鏈公鏈上。
中美 AIGC 賺錢的差異
依然先亮出我的結論:中美 AIGC 的差距至少在一年以上。另外,美國所有的融資項目必然關聯 AI。在國内與美國如此巨大的信息差異下,幾乎只有 To B 市場擁有巨大的機會。
我們都知道,全世界的 AI 幾乎被三巨頭統領了。OpenAI 作為 ChatGPT 的開發者,在市場上具有顯著競争優勢。Google 在早期是領頭位置,後面被 OpenAI 一舉超越了,後面它開始在細分領網域裡做嘗試。Meta AI 相比前兩家,勢頭要弱一些。它的主營業務 LLama,可以在單個 GPU 上運行。
可以看到,一些大模型早期都是運用了開源模型的底子,所以這可以成為我們借鑑的方式。當美國那邊一些比較成熟的產品出來之後,我們再對其進行效仿和跟随,風險性會小很多。
目前來看,國内的競品還不甚成熟,短時間内國内的大模型在 To C 端的服務和體驗類產品上還存在很大的問題。相較而言,To B 市場則要有前景一些。
伊隆馬斯克也曾說中國和美國在 AI 技術上的差距為一年以上。雖然這句話聽起來讓我們感到很振奮,但确實只是他的一句客套話。因為目前芯片像是卡住了這行的脖子,國内采購芯片要麼很困難,要麼就是不正規的版本。而大模型離不開芯片,需要上萬個芯片連在一起進行分布式的計算。同時如何設計一個可以讓上萬個芯片一起工作的作業系統來加快計算也是需要長時間來實踐的。而這對我們來說是一個巨大的鴻溝。
當然,芯片方面我國正在努力推進,但這并不是短時間就能解決的問題。另外,我國在人才的質量和數量上與美國的差距也是不能忽視的方面。所以雖然我們需要對自己保持信息,但同時也要清楚目前所處的位置。
中國與美國相比的确尚有段路要走,但其中仍然存在着一些機會:
我首先推薦一個名叫 Hugging Face 的 AI 開源社區。它被稱為 AI 領網域的 GitHub,成立于 2016 年,團隊将近 170 人,總部位于紐約。目前,Hugging Face 上有超過 20000 個開源數據集,超過 10 萬個 demo,有超 10000 家公司使用上面的開源的 AI 技術。
如果我們的公司如果在做項目時需要用到一些技術方案,我建議可以在這個平台上找一找,這能幫我們節省很多的精力。這個平台還支持語音轉換、文字轉換等功能,使用起來十分便捷。
AI 的開源雲是現在國外努力的一個方向,這個技術支持在雲端快速地訂購產品。這個項目的負責人是之前在蘋果公司裡的一個高級工程師,他現在帶領着團隊專攻這一領網域,如果最終他們真的能夠做到,就可以讓很多企業快速上手智能服務。那時候很多小公司或個人可以把自己的模型上傳至平台,提供給大家使用。
另外還有一些反對 AI 開源的聲音。他們認為開源如果放在某個人的手裡,就相當于這個人手持了一枚原子彈,具有毀滅性的威力。對公司而言,如果掌握了這個開源模型,就會導致對生產效率的需求沒有以往那麼大,有些公司可以快速地把產品做出來,然後把一些内容放在開源的雲平台上,為大家提供服務。這意味着,未來的小公司或個人公司會大規模出現。
講到這裡,我覺得我的結論比較明顯了:
1. 我認為國内一定會出現自己的大模型,雖然暫時人才還比較稀缺,但在累積夠一定的經驗過後,一定會有培養出大量的人才。但是,大模型可能各有各的特點,就跟做菜的一樣,同樣的食材用不同的方法烹饪,做出來的味道就會迥然不同。但特點也意味着多元,多元意味着豐富。
2. 對于中小企業來說,如果想乘一乘這波 AI 的東風,開源的小模型需要尤其關注。我斷定它在未來會湧現出很多機會。
3. 最後還想說,面對新時代的到來,我們往往會因為措手不及而感到焦慮。但是與其焦慮,不如放平心态、活在當下。有太多太多的技術我們都看不明白,但是站在歷史的十字關口,我們能做的就是接受現實,并且勇往直前。
我希望在未來,中國能在 AI 領網域上實現巨大的突破,因為那将改變整個社會,改變全人類。
提問環節:
主持人:您覺得下一代擁有怎樣的能力,能更好地去迎接 AI 時代?
章鵬:我覺得邏輯思維和哲科思維是必須的思維能力。人要與機器相處,就無可避免需要邏輯思維能力,才能把機器的能力充分地調用出來。至于哲科思維,我認為這是 AI 比較欠缺的能力,因此未來的人類想要與 AI 競争,可以在 AI 的短板領網域裡發揮所長,這樣更具有競争力。
主持人:作為創新院的老校友,是怎樣的驅動力讓您又讀了一期?
章鵬:在疫情前我接觸了李善友教授的課程,他的 " 第一性原理 " 理論讓我印象深刻。但是現在的時代迭代的速度是特别快的,上一次的課程我沒有完全吸收 " 第二曲線 " 和 " 創新理論 " 的奧義,所以想要重修一次,努力跟上時代的迭代速度。
主持人:23 級我們已經進行了兩個模塊的課程,您覺得最大的收獲是什麼?
章鵬:我覺得這是一個不内卷的環境。雖然我們每天都會做一些刻意練習,在一起相互學習,但都是懷着互幫互助、相互激發的善意。混沌的教學讓我從以往過多依賴 " 聽 " 的學習方式裡走出來,利用和同學的碰撞,提升了學習的效率。在一起讨論的時候,别人輸出的想法,總能啟發到我;我自己輸出的想法,也在這個過程中有了更深的思考。
主持人:在這樣一個濃度很高的場網域裡面,最讓你印象深刻的價值點是什麼?
章鵬:這兩次課程讓我印象最深的點是 " 第一曲線 "。其實很多人的第一曲線都沒有被擊穿,一旦擊穿,會發現自己身上巨大的能量,所以這是我認為非常有實用價值的看世界的方式。同樣我也經常推薦身邊的朋友通過混沌的課程擊穿自己的 " 第一曲線 "。
>