今天小編分享的科學經驗:AI應用路線圖:可控性是最強路标,歡迎閱讀。
以下文章來源于半輕人 ,作者王詠剛
生成式 AI 的應用場景在哪裡
Stable Diffusion、ChatGPT 等生成式 AI 技術(Generative AI)在 2023 年上半年吸引了 IT 創投圈的最多注意力。當我們稍稍從波瀾壯闊的新技術浪潮中回過神來,開始認真思考到底什麼樣的應用場景才是生成式 AI 的最佳落地方向時,很多人還是會發現,科技與市場之間的關系錯綜復雜,很難梳理出生成式 AI 落地的最佳路徑:
某投資人:這幾個月來,一線風投機構全體動員,忙得昏天黑地,結果發現除了四五家頭部大模型創業項目被大家追捧外,其他 AIGC 項目都看不清,不敢投,不知道未來 AI 應用會向哪裡發展。
某分析師:幾家頭部大模型項目投入大,風險也高;所有 B 端、政府端應用受限于私有部署和私有數據的制約,周期長,難落地;C 端應用大部分都太淺太薄,文本和影像生成項目同質化嚴重;有一兩篇好論文就出來創業的現象很普遍,但團隊自己也想不清具體應用落地方向……
這裡面最大的思維症結是:
大多數人還是在潛意識裡把生成式 AI 看成是一組生成對話、文章、圖片的工具。按這樣的刻板印象:這東西只能幫文案工作者、設計師提高提高效率,哪裡稱得上颠覆式的變革?
雖然有許多迹象表明,生成式 AI 顯露出通用人工智能(AGI)的曙光,但受限于短期價值判斷的人總會說:曙光又怎樣?眼見為實。今天的 AI 不還是在聊天兒、寫文章、畫畫兒嗎?
顯然,僅停留在單一視角或單一時間節點來分析生成式 AI 的應用前景是不可取的。有沒有串聯起生成式 AI 的發展脈絡,簡明易用的思考模型呢?
圍繞可控性建立思考模型
我們認為,生成式 AI 是可以與桌面計算、移動計算相提并論甚至更具颠覆效應的信息產業革命。颠覆式變革從來都不是一蹴而就,而要随着生成式 AI 的不斷發展、不斷進步逐漸實現。如果想看清、看透生成式 AI 即将帶來哪些新產品、新平台、新市場、新機會,我們覺得,有一條簡明易懂,也易于指導產品選型、項目選型的思維路徑:
生成式 AI 的可控性越強,對市場和產業的颠覆性就越大!
這條路徑可以簡單用一張圖來表示:
随着生成式 AI 對生成内容的可控性不斷提高,生成式 AI 适用的應用場景也會不斷擴展和深化。量變引起質變。一旦突破領網域阈值,生成式 AI 就可以徹底改造現有的產品生态,為產品賦予真正的智能元素。
演進過程中,生成式 AI 的可控性大致會經歷六個階段。以最基本的文本生成為例:
階段 1:不可控
20 多年前,基于 N-grams 算法的統計語言模型也可以生成連續的文本内容。只不過,生成的結果基本不可控。如此早期形态的 " 生成式 AI" 幾乎沒有轉化到產品的可能性,更談不上颠覆已有市場了。
階段 2:概略方向可控
從基于 LSTM 或 RNN 的文本生成,到早期 GPT(如 GPT-2)的文本生成,生成式 AI 逐漸擁有了描摹一段類似人類語言文字的能力。這一階段的描摹能力,基本可以達到文句通順,内容大致符合人類給出的提示,但因為細節、結構或邏輯不可控,還是很難轉化成真正有用的產品。
階段 3:結構或局部邏輯可控
從 GPT-3 到 ChatGPT(GPT-3.5),生成式 AI 第一次擁有了對生成内容的結構和局部邏輯的控制力。文字創作和多輪會話是這個時期的兩種典型應用生态。前者可以支持自動文章摘要,法律文書生成,營銷文案生成等實用場景,後者則可以滿足會話式搜索,語言學習,智能客服,虛拟人,智能遊戲角色的部分需要。
階段 4:初步的思維鏈可控
從 GPT-3.5 到 GPT-4,生成式 AI 的邏輯推理能力顯著提高。生成式 AI 第一次擁有了強大的分析能力(如從新聞報道中提取數據,總結趨勢),控制能力(如将人類語言轉化成復雜系統控制指令)和初步的邏輯推理能力(如解答簡單的數學、邏輯題)。可生成的文本内容也擴展到數據、表格、代碼、指令序列、工作流或工具鏈等結構化、半結構化文本。這直接引發了今天一大批以 Copilot(直譯為 " 副駕駛 ")為特征的新工具、新系統。
階段 5:復雜邏輯推理可控
當然,今天的 GPT-4 生成文本時,可以控制的邏輯思維鏈還處在初級階段。如果一切順利,人類有望在不太遠的将來研發出可精确控制復雜邏輯推理的下一代生成式 AI。這樣的 AI 具備記憶、學習、規劃、決策等高級邏輯推理能力。這些能力足以在效率工具、内容平台、商業流程自動化、機器人、作業系統、智能設備等場景裡,徹底颠覆過去數十年的人機互動形态,重新定義人類與計算機的關系。
階段 6:規則或原理可控
更前瞻一些看,人類思維的最高階表現是:一、基于歸納思維發現原理、制定規則;二、基于演繹思維将原理或規則應用到具體場景中。生成式 AI 的理想進化形态是接近人類思維方式,生成與人類思維水平相當的規則或原理,并加以應用。一旦達到規則或原理可控的 " 自由王國 ",生成式 AI 必将擁有強大的自我迭代、自我改進的能力,可以像人類一樣設計系統規則、世界規則,甚至與人類科學家一道開展科學研究。
可控性與典型應用方向
生成式 AI 可控性的提升帶來适用領網域的大幅擴展。我們用下圖概括生成式 AI 在不同發展階段,可控性與最佳應用方向之間的關系:
以可控性為脈絡,生成式 AI 在每個發展階段,支持的應用方向不斷擴展、深化,從滿足簡單、局部需求,逐步發展到滿足領網域、平台需求,并最終積累到產品和商業模式的颠覆性變革。思維鏈、邏輯推理是否可控,在多大程度上可以精準控制,是這個量變到質變過程裡最關鍵的因素。
可控性與具體應用案例
以生成式 AI 的可控性為脈絡,我們将今天和近未來的生成式 AI 最适合的應用方向抽成四個大類,并用下圖将每個大類中的典型應用案例與生成式 AI 的不同發展階段關聯起來:
内容創建工具 / 内容平台
内容創建工具是生成式 AI 落地最直接也最快捷的場景。随着生成式 AI 可控性的提升,内容創建任務會從簡單的文本、圖片創建,過渡到復雜的視頻、3D、動畫、遊戲、影視、虛拟世界等的自動創建。借助 AI,每個普通人都将擁有原本只屬于專業團隊、專業工具的能力。普通人的創作欲一旦得到大幅釋放,有關新内容形式的分享、觀賞、購買、社交等更高層級的需求就必将帶動新一代内容平台的誕生、發展和壯大。
商業自動化 / 企業服務
限于數據安全、私有部署、内容準确性及合規性等原因,商業流程對生成式 AI 的可控性要求非常高。今天的生成式 AI 最适合落地的商業領網域可能包括市場營銷中的内容創建和電商的用戶界面。此外,生成式 AI 也可以通過自動生成 SQL 等中間代碼,自動采集分析數據,自動生成報表,自動連接業務流程等,大幅提高商業效率。未來,随着生成式 AI 可控性的提高,商業流程中的規劃、決策、優化等關鍵過程,一定會吸納更多的前沿 AI 技術。
個人助理 / 專業助理
個人生活和辦公場景中,生成式 AI 将逐漸以各類不同形态的 " 助理 " 身份,在數年内建立起人與 AI 相互協作的新生态。生成式 AI 的可控性有多強,從根本上決定了我們生活或工作中的 AI 助理有多聰明,可以幫我們解決哪些問題。一旦生成式 AI 在一部分工作中具備與人類文秘、司機、譯員、律師等角色相當的水平,AI 助理就會成為替代計算機、手機的新一代大眾電子產品。
基礎架構 / 開發工具 / 作業系統 / 搜索引擎
生成式 AI 的編程能力,數據處理能力,系統設計能力,知識處理能力等,将為開發工具、數據庫、搜索引擎、作業系統提供全新的設計理念和跨時代的新功能。未來是否能真正誕生 AI 為核心的作業系統,AI 為核心的智能計算平台,完全取決于生成式 AI 的復雜邏輯推理能力到底能達到怎樣的高度。
多模态 AI 的應用能力演進
與簡單的文本生成、圖片生成相比,包含聲音、視頻、3D 場景、動畫、復雜故事線的多模态系統與人類的常識感受和本源需求更加契合,明顯擁有更寬廣和深遠的應用前景。有關多模态 AI 的技術現狀和前景展望,可以參見本文作者的另一篇文章:後 GPT 時代,多模态是最大的機會。
在多模态領網域,我們認為,今天和未來的生成式 AI 會大致按照下圖所示的脈絡演進積累,不斷催生有革命意義的新應用、新平台甚至颠覆性的新商業模式:
使用許可
以上所有應用路線圖的圖片和文字内容,均由 SeedV 實驗室以 CC BY 4.0 協定發布。大家在注明原始出處(SeedV 實驗室)的基礎上,可自由使用、修改、再發布。
>