今天小編分享的互聯網經驗:大模型應用落地,AIGC板塊投資邏輯分析,歡迎閱讀。
ChatGPT 即将出世滿周年。在這一年内,面對全新的市場,諸多公司湧入大模型賽道,形成 " 百模大戰 " 的盛況。" 狂飙 " 的大模型,并不囿于通用領網域,也正以飛快的速度向各個場景滲透。據不完全統計,已有十餘家 A 股上市公司計劃涉足金融大模型。二級市場,多模态 AI、MR 是最近較為強勢的概念,AIGC 板塊有何投資邏輯?今天《Helen ’ s 财經晚餐》邀請到灼識咨詢 CIC 總監陳一心來做深度分享。
附上本期直播時間軸,幫你快速跳轉感興趣的部分
01:39 大模型演變經歷的一些階段
06:00 目前大模型已經開始滲透到金融、醫療、汽車制造、零售等行業,具體應用能否舉例?
09:10 大模型在哪些領網域可能超過人類?大模型迭代的重點又在哪裡?
17:42 作為一種先進的生產力變革,AIGC 的興起讓世界進入了智能創作時代。它對企業和個人分别有哪些價值?
20:46 AIGC 產業鏈涉及哪些?
24:26 大模型企業的算力投入
30:30 AIGC 板塊投資邏輯
34:02 GPGPU 產業鏈的上遊、中遊、下遊,以及涉及的代表性公司
Helen:最近你們發布了《大模型與 AIGC 藍皮書》,對行業做了深度分析,我們今天的分享從產業現狀延伸到投資邏輯。首先請介紹大模型演變經歷了哪些階段?
陳一心:大模型是基于海量多源數據打造的模型,是實現通用人工智能 ( AGI ) 的重要路徑。大模型可以整合多種不同類型的數據和信息,實現多模态處理和分析,從而更全面地理解和解決復雜問題,其具備通用性、湧現性等諸多特點。
大模型從其形态來看,有幾類,第一類我們姑且叫做 " 基礎大模型 "。基礎大模型通常是面向通用領網域進行開發的,知識儲備量較大,能實現語言理解和生成,質量也還不錯。但因為基礎大模型通常更标準化,适用場景更普适、寬泛一些,所以更多是 C 端用戶使用在一些壓力不算大、或者比較簡單的場景。想要 B 端應用的話還是有些吃力的,因為不夠精,也暫時無法貼合 B 端企業更加專業和個性化要求,直接生成結果的質量對商用場景而言可能是不夠的。
第二類我們叫精調大模型。精調大模型一般是基于基礎大模型,進行更有針對性和細致的優化。不論是在某一領網域專用性上的,還是在模型易用性上的,都是為了能讓用戶根據自己的實際場景需求,很容易地來使用大模型,并且達到高度可用的水平。我們認為精調大模型更重要的價值在于可以更好地滿足 B 端客戶的需求,達到能夠商用的水準、并且為企業的實際運營和決策賦能。這個也可以理解為是 " 行業大模型 "
剛剛也提到大模型在不斷演進和完善,這裡也想分享一個概念,叫能力湧現。用簡單的話來解釋 " 湧現 " 的意思,就是由量變達到質變的那個階段。對于 AI 模型來說,能力湧現就是模型的規模達到某個臨界點後,模型的表現會有一個質的提升。能力湧現的大模型其實并不算是大模型的一種形态,而是揭示了一個規律,就跟當年的摩爾定律有些類似,就是模型的參數越多,它越有可能在各類任務上有更好的表現。可以說明過去幾年模型的參數規模越來越大所帶來的一個好處。
不過,我們也看到目前可能也有個趨勢,就是開始把大模型做小。不要誤會,即使把大模型的參數規模做小,它也還是個很大的模型,參數量至少在百億級别。我們看到有些研究去驗證,小模型是否也能實現能力湧現。根據目前的研究發現,小模型在某一些任務上似乎也是具備湧現能力的,但不确定是否能泛化到其他任務中。這給大模型行業的一個啟示就是,未來是有可能通過各種優化手段把大模型的規模盡量減小,但依然保持其輸出質量。
Helen:目前大模型已經開始滲透到金融、醫療、汽車制造、零售等行業,具體應用能否舉例?
陳一心:大模型已經廣泛應用于金融、醫療、汽車制造等領網域,如風險控制評估、交易環節等。大模型的優勢在于性能和互動性的提高,使其更适合處理復雜任務和與人類的溝通方式。此外,大模型還在各領網域不斷演進,例如在零售領網域的個性化推薦、定價優化等方面也有所應用。
在金融領網域,大模型主要應用包括風險評估、量化交易、櫃台業務辦理等。以風險評估為例,大模型可用于預測信用風險、 欺詐檢測和市場趨勢分析。在醫療領網域,大模型可應用于疾病診斷、 藥物發現等場景。以疾病診斷為例,大模型可用于醫學影像識别,如 X 射線、MRI 和 CT 掃描,以幫助醫生診斷疾病。在汽車領網域,大模型可應用于自動駕駛、 虛拟設計和仿真、質量控制、供應鏈管理、銷售和營銷、定制設計、新能源汽車性能優化等。在制造業領網域,大模型主要應用場景包括工業自動化、供應鏈優化等。以工業自動化為例,大模型可用于監控生產過程,預測設備故障,提高生產效率。在零售行業,大模型可應用于個性化推薦、 價格優化等場景。
Helen:大模型未來可能在哪些領網域超過人類?
陳一心:至少有一點特征是比較明顯的,不論大模型輸出内容的質量如何,它的輸出速度 / 效率大概率是高于一般人的。輸出文字可能是大家目前自己用得最多的,相信感受會比較深刻;除此之外,代碼、圖畫、視頻、3D 建模等,這種本身工程量就很大、非常花時間的領網域,這種體感可能就更明顯。而且這些是我們作為普通 C 端用戶就可以切實感受到的。
回到具體大模型在各領網域的表現,我覺得抽成 3 個層次,分别是已經做到且能與人類媲美,已經做到但還不及人類,還做不到。首先,現在大模型已經可以和人類媲美的方面有:視覺 / 聽覺識别,學習能力,自然語言理解等,這其實是在大模型出現之前,其他 AI 模型就已經在嘗試攻克的領網域,而大模型直接加速了這個進程并且讓所有人都能體會到。其次,大模型已經具備但需要改進的有:創造性思維、抽象思維、藝術表現等,這些領網域一定程度上依賴于人類的審美、創造或邏輯能力,大模型需要繼續精進才能趕上。最後,大模型還不具備的是對倫理是非的判斷、直覺等,這些其實接近了 " 人性 " 的範疇,大模型目前只能嘗試去總結、模仿,但無法達到人類的水平。
Helen:大模型產品未來有怎樣的發展趨勢?
陳一心:多模态模型是一種能更好地理解、生成語言的技術,其核心優勢在于對大規模語言數據集的學習能力和理解能力。通過多模态技術,我們可以更好地捕捉用戶的情感、意圖等信息,從而提高交流體驗。此外,多模态模型還能幫助我們生成更高質量的文章和對話,這對于企業和個人的工作和生活都非常有益。随着人工智能技術的發展,未來多模态模型将極大地推動各行各業的發展,為人類帶來更多的便利和創新。
其次是對于大模型性能的進一步提升,讓内容輸出質量更好、速度更快、處理更加復雜的任務,對于比較雜亂的内容也能夠進行梳理,有更好的邏輯推理能力。此外,比較重要的趨勢是建立更包容的開放生态,比如最近 GPT4-Turbo 的發布,也同步發布了類似 App Store 的平台,用戶可以上傳專屬的 GPT 模型,由此建立起開發者、創作者生态,源源不斷地為開發者社區注入活力。
Helen:AIGC 有望掀起新一輪產業革命,它對企業和個人分别有哪些價值?如何提升其工作效率?
陳一心:AIGC 的終極目标是結合 PGC 和 UGC 的優點。PGC 的優點是内容可控,質量上乘;UGC 的優點則是内容生產效率高、性價比高。AIGC 要做到的就是在高效產出的同時,保證内容質量。這樣對企業來說,就是降低了高質量内容的創作邊際成本。對個人用戶來說,有了 AIGC 的幫助,大幅降低了内容創作的門檻。未來繼續發展的話,我們剛說到多模态是大模型發展的一大趨勢,未來的 AIGC 一定也會受益于大模型大發展,因此可以預見的是,AIGC 在未來也會具備更成熟的多模态内容創造能力,增加内容創作的多樣性。
Helen:AIGC 產業鏈涉及哪些?
陳一心:AIGC 產業仍處于早期發展階段,在數據、算法和算力的基礎之上,核心模型以關鍵企業研究成果為主導,AIGC 以 AI 生成文本、影像、視頻和音頻為主流形式。上遊是基礎層,包括數據、算法及模型、算力。數據包括業務數據連通、素材數據搜集等;算法及模型包含神經網絡、深度學習、自然語言處理技術、擴散模型、 雲渲染等開源算法,以及基于算法通過數據訓練生成的機器學習模型、深度學習模型及大模型等。算力包括伺服器、GPU、 HPC、雲等提供基本計算能力的基礎設施。中層也就是應用層,包括文本生成、影像與視頻生成、音頻生成。應用層的產品使用上遊的算法模型框架,進行針對性的優化,價值是在于充分發揮某一類大模型算法或者框架的特長,給用戶帶來更加良好的使用體驗。下遊就是終端用戶層,包含各類内容創作及分發平台、内容終端生產廠商、第三方内容服務機構,等等。
Helen:算力提升是 AIGC 發展的重要驅動力之一,愈大的算力規模可以支撐更大規模的模型運轉。算力芯片、AI 伺服器有望持續放量,數據中心建設提速。各國紛紛提速數據中心建設,我國 " 東數西算 " 工程投資規劃逐步清晰。在 A 股市場上,已有很多家企業抛出了定增募資計劃拟進軍該行業。您對這些企業有何建議?
陳一心:我們現在能看到大模型在 B 端商用中實際落地的方式,主要是把大模型濃縮成一個相對輕量的行業小模型,專攻一個相對垂直的領網域。一方面可以顯著縮小模型的參數量,這樣在訓練和推理過程中所需要消耗的算力也會随之變小;另一方面,分别以合理的成本攻克一個個專業領網域,似乎是目前更平衡的一種方式。所謂的金融大模型,其實我們也可以認為是一個相對輕量的行業小模型,專攻金融領網域的一個應用,比如風控、營銷等。這對企業的實際應用才更具有價值。
另一個最近比較火的大模型應用,是手機大模型。從研發側來看,手機廠商在人工智能大模型的投入确實需要大量的資源和資金。與國内領先的大模型廠商相比,手機廠商在算力基礎設施上的儲備往往不夠充足,這使得他們在研發過程中經常遇到算力受限的情況。對于手機廠商來說,這一投入不僅需要大量的資金,還會面臨技術上的挑戰。
從應用側來看,輕量化本地部署是手機大模型的一個重要趨勢。由于用戶隐私、響應及時程度和雲端使用成本等因素的考慮,手機大模型需要以端側部署為主。這意味着大模型将直接部署到手機内,并由手機芯片承擔模型推理的工作。為了實現輕量化本地部署,手機廠商需要開發出适合在手機中運行的大模型,這需要使用更少的數據量和計算資源。同時,還需要優化模型的推理速度和精度,以确保模型能夠在手機上高效運行。
Helen:AIGC 板塊投資邏輯是怎樣的?
陳一心:投資者應關注公司是否具備過硬的技術基礎,如大規模計算、深度學習和神經網絡等先進技術,評判大模型技術,要綜合各種信息去看。可能因為使用了不同的流程和标準,各家評測機構的結果差異巨大;其次是要看公司在特定細分市場的落地場景,例如金融領網域的大數據分析能力,或零售業的數字化轉型等。是否真正落地以及怎樣落地,對于 B 端企業價值更高。
大模型產業在過去一年得到了廣泛關注,但投資者仍需關注其技術能力和落地場景。此外,還提到了 GPG PU(通用圖形處理器)的高并發計算資源在大模型訓練和推理方面的作用。GPG PU 產業鏈涉及多個環節,如半導體 IP 服務提供商、晶圓設計商等,為企業提供核心技術支持。同時,各行業的企業也在努力開發相關技術和產品以滿足市場需求。
以上是本期 Helen's 财經晚餐的部分内容,想看完整内容,可觀看 Helen's 财經晚餐第 50 期《大模型應用落地,AIGC 板塊投資邏輯分析》直播回放。
Helen's 财經晚餐每雙周二 17 點開播,直播将在钛媒體 APP、钛媒體 PC、钛媒體微博、钛媒體視頻号、钛媒體百家号同步直播。(主理人:Helen;策劃:Helen ;導播:羽赫;文章:Helen)