今天小編分享的互聯網經驗:The State of Generative AI 2023,歡迎閱讀。
在 2023 世界人工智能大會(WAIC)啟明創投論壇 " 生成式 AI 與大模型:變革與創新 " 上,啟明創投攜手未盡研究,共同發布重磅報告《生成式 AI》| State of Generative AI 2023。
如果說 2022 年被稱為生成式人工智能之年,擴散模型應用取得突破,ChatGPT 出世,一系列開創性的研究論文發表,2023 年則把大模型推向了一個高峰,以 GPT-4 發布為标志,生成式人工智能,朝着通用人工智能的方向,進入了創新應用的階段。
這一階段最重要的特征,是應用、研究、監管,合力開辟着生成式人工智能的創新之路。
01/ 創新應用
人們很快從生成式人工智能中看到了新的商業生态的出現,看到了一層又一層的技術,如計算、模型和應用;看到了生成的内容,如文、圖、視頻、代碼、3D 結構、多模态;也看到了公開數據、垂直數據、合成數據、向量數據,用于大大小小的模型。
生成式人工智能,在中國似乎受到了更加熱情的接納:政府鼓勵發展通用人工智能;任何一家大企業都無法不關注它;許多從事知識工作的中小企業,已經先用起來再說。面對這一革命性的技術,所有企業都被卷入。它們節奏不同,介入程度不同,成為新技術浪潮下的守成者、創新者、采納者。它們的利潤率被永久的改變了。
算力目前是最稀缺的資源,也處于最容易獲利的要津。算力是大模型成本結構中最大的一塊,GPU 的性能,實際上決定了這個新興行業的步調。随着算力與模型的進步,更多初創企業正在湧入,它們搶到了時間的紅利,但也面臨競争和可能的巨頭碾壓。可以說,這是初創企業的藍海,也有航道下的暗礁。
競争促進了創新。與 2022 年快速湧現出的生產力工具方向的創業公司不同,2023 年,有更多比例的新公司聚焦在底層技術的創新;大模型創業公司也開始分化,在通用大模型創業公司方興未艾的同時,許多面向醫療、電商、科研、工業、自動駕駛和機器人等特定方向的垂直大模型公司開始出現。
02/ 前沿研究
2022 年和 2023 年,是生成式人工智能技術取得突破的兩年,我們梳理了論文,發現生成式人工智能領網域的一個突出特征,是研究與創新過程的密切結合,許多在企業内部實現,迅速推出用例和產品。這種研究與創業的一體化,初創企業和風險資本起到了重要的作用,而美國科技巨頭和主要人工智能企業的研究投入與人才,包括一些底層技術的研究,這些年來已經超過了大學等研究機構。
人工智能的前沿正在向未來推進。盡管從 GPT-4 的技術報告,到微軟的研究論文,都展示出它所具有的接近于人類的文字處理能力、數學推理能力,以及諸多專業領網域的知識。" 我們認為它可以合理地被視為人工通用智能(AGI)系統的早期(盡管仍不完整)版本。" 但是,在通往通用人工智能的道路上,需要研究和解決的問題反而更多了。如信心校準、長期記憶、持續學習、個性化、規劃和概念跨越、透明度、認知謬誤和非理性,等等。
過去半年最重要的研究方向,是破解和理解大模型神秘而又令人興奮的智能 " 湧現 "。大模型既需要超越對下一個詞的預測能力,也需要一個更豐富、更復雜的 " 慢思考 " 深層機制,來監督 " 快思考 " 預測下一個詞的機制。
那些最好的前沿研究,一定是研究和解決技術規模應用中遇到的問題。研究如何減少幻覺,調教大模型更加準确地輸出真實的内容,訓練出更強的推理能力;如何更集約地訓練模型,降低門檻,推出新產品,讓更多的各行各業和消費者都能用上;如何能像人一樣,與真實的物理世界互動;如何成為人類復雜工作的助手,設計并幫助執行科學實驗;如何影響就業,從而做出政策的響應;如何讓人工智能安全和可信。
03/ 監管 | 安全 | 政策 | 人才
政府對于生成式人工智能的監管反應相當及時,各國也出現了不同的特點。中國在迅速推出生成式人工智能的監管辦法并征求意見的同時,也在鼓勵發展通用人工智能,北京、上海、深圳是最具雄心的第一梯隊,均提出了較具雄心的人工智能科研、創新與產業目标。歐盟繼續在監管和立法方面領先,一如其 5 年前率先推出 GDPR。美國更在意人工智能技術的領先地位,正在形成以風險管理為原則的監管框架。
長期來看,人才對人工智能未來的影響,超過了算力。中國研究人員發布的論文在數量上已經超過了美國,但金字塔頂端,無論是研究還是創業,美國仍然占據明顯的優勢。在全球範圍内,人工智能研究創新的重心正從高校轉移至企業,美國擁有頂尖學者最多的前三大機構,分别是谷歌、微軟與 Meta,合計招攬了美國頂級學者的 30%。中國仍以高校為主,僅阿裡巴巴跻身前 10。
科技部已經提出了人工智能企業,應該接受科技倫理審查;審查主體應該設立科技倫理(審查)委員會。美國人工智能企業較早開始設立負責任與可信人工智能部門,從去年到今年以來經過一些調整,反映出在生成式人工智能發生變革之際,企業正在尋求用更好的技術和方案,來安全和負責地部署新技術。
04/ 十大前瞻
大語言模型
1. 2024 年中國将出現比肩 GPT-4 的多語言通用大模型;
2. 超長上下文(Long Context)将引領下一次 LLM 技術突破;
3. 在出現更有前景的大語言模型之前,為實現垂直領網域更好的效果,以下三種方式将共存:
i)在不改變數據分布的情況下,利用更多通用數據進行通用大模型預訓練,不特别引入行業數據,
ii)利用行業專屬數據微調(Fine-Tuning)通用大模型,
iii)利用行業數據占比更高的數據集進行垂直模型預訓練。
多模态模型
4. 當前 CLIP + Diffusion 的文生圖模型是過渡态,未來 2 年内将出現一體化的模型結構;
5. 下一代 Text-to-Image 模型将具備更強的可控性,它将結合底層模型能力和前端控制方式,對模型的設計将注重與控制方式的結合;
6. 2025 年之前,Video 和 3D 等模态将迎來裡程碑式的模型,大幅提高生成效果;
7. 以 PALM-E 為代表的具身智能(Embodied AI)展現出在機器人的感知、理解和決策等方向上的巨大潛力,但當前訓練和可靠性存在較大挑戰;
8. 短期内 Transformer 正成為多個模态的主流網絡結構,但壓縮整個數字世界的通用方法尚未出現,Transformer 并不是人工智能技術的終點。
商業機會
9. 3 年内,颠覆式的 AI 應用的核心驅動力來自于底層模型的創新,兩者無法解耦,模型的作用将大于產品設計的作用;
10. 當前生成式 AI 市場處于技術主導的早期階段,存在千億美元市值的平台性企業的機會。