今天小編分享的科技經驗:大模型時代,「數據飛輪」怎麼做?,歡迎閱讀。
數據飛輪,是今年大模型帶火的一個典型詞匯,通過客戶在應用程式中輸入的提示詞這樣的數據反饋,使大模型快速迭代。今年初,數據飛輪也曾一度被視為 OpenAI 最重要的先發優勢。
但在 All in 大模型的下半年,數據飛輪成為了大模型廠商最頭疼的事情。此前在極客公園舉辦的一場大模型研讨會中,不少創業者表示,「用戶都看重數據資產,不願意把數據拿出來,模型廠商幫助客戶訓好模型,做本地部署,做完了『淨身出戶』,數據飛輪很難建立起來」。
從 A/B 測試裡跑出來的今日頭條,基于數據分析選品、調度的抖音直播,火山引擎數據平台擁有這兩個互聯網最豔羨的業務實踐,火山引擎如何看待大模型的數據飛輪問題?
帶着這樣的好奇,極客公園在 9 月 19 日 V-Tech 數據驅動科技峰會上,采訪了火山引擎總裁譚待。他表示,大模型的數據飛輪問題首先要合規,其次,很多企業願意與模型廠商共創,從而可以讓大模型廠商的大模型數據飛輪轉起來。
火山引擎 V-Tech 數據驅動科技峰會|來源:火山引擎
另一方面,在數據平台的產品層面,火山有更多的數據飛輪實踐。
峰會上,譚待和字節跳動數據平台負責人羅旋,介紹了火山引擎在數據平台層面接入的大模型功能探索。其中,在類 BI(Business Intelligence,商業智能)產品、自動駕駛艙等產品中引入了 AI 助手;在數據管理產品中引入了 AI 自動補全代碼和修正代碼等功能;目前,相關數據產品已啟動邀測。據悉,這幾款產品的AIGC功能背後,是基于火山自己的大模型——雲雀(目前在内測中)。上個月底,雲雀大模型通過了《生成式人工智能服務管理暫行辦法》備案。
事實上,大模型在數據類產品的落地,還有一定距離。
6 月以來,不少數據產品都引入了 AI 助手這樣的功能,目前產業界普遍仍在打磨落地中,要實現任何自然語言精準「召喚」出想要的數據形式,還需要幾年的探索時間。火山引擎總裁譚待也表示,真正有比較好的 AI 原生應用出來,可能要等到底座模型本身至少具備GPT3.5+ 以上水平,才會清晰一些。
但在理念上,火山引擎提出了不同的數據飛輪理念,數據驅動最終是一定要落在企業不同人員對數據的消費上,以此來建設數據產品,把數據「推」到最廣泛的數據消費者面前,最終形成基于數據分析的一致行動。這能解決近年來飽受争議的數據中台難落地的問題。
關于上述問題,譚待和羅旋接受了包括極客公園的采訪,以下是對話節選:
數據,必須被「消費」
問:峰會上推出的找數助手、開發助手、分析助手幾款工具,用戶會以什麼樣的方式獲取這些服務?
羅旋:因為 AI 本身也在快速發展過程中,產品經過一段實踐,不能算是成熟的狀态,我們希望一點點逐漸打磨產品。前期先邀測,不會大規模放開,希望有一些客戶能夠深度跟我們共創,更成熟以後,再大規模對外公開。
問:這些AI助手用了什麼大模型?
羅旋:我們現在主要依賴于字節本身有一個雲雀大模型,以及火山方舟 MaaS 平台上有一些合作夥伴的大模型。
問:怎麼理解「以消費為核心」的數據驅動?
譚待:回到最大的根本,做這件事情,還是希望把目标定清楚,最後其實是以數據消費為目标來做這個事情。跟過去五六年業界講的數據中台的概念相比,這是一個更大的更新,而且是更有效解決企業數據產生價值的問題。
否則,很多企業投入大量的資源,建完之後有數據,但是沒有利用起來,本質就是沒有想清楚最終應該圍繞什麼來做這件事情。以前我們做建設的時候,目标是有偏差的,比如我建一個中台其實不是目标,是實現數據驅動的一個手段。
所以我們提出了數據消費、數據飛輪這樣的邏輯。企業建設數據時,應該把數據消費作為目标,比如峰會講的兩個 80%:一是 80% 的企業員工能夠用到,二是能覆蓋到 80% 的分析場景。
圍繞數據消費,我們的體系叫數據飛輪,數據飛輪上層是跟應用相關,這些產品裡面大部分确實是 SaaS 的形态,也有一些會是 PaaS 的形态。下一層是數據資產的建設,這些主要是 PaaS 為主,通過數據消費這個事情端到端應用起來,就能解決過去企業數據建設過程中,數據團隊和業務團隊互相不理解導致最後效果不好的問題。
火山引擎全套數據平台產品|拍攝:極客公園
問:火山引擎一整套數據飛輪的產品,如果跟 SnowFlake 相比的話,有哪些相同的地方,有哪些不同的地方?
羅旋:SnowFlake 本質上更多是數倉的引擎,公司做大以後也嘗試着往更多數據分析這邊去走,但是更多是從基礎層的引擎往上做。
我們切入的角度不一樣,我們更強調業務,比如 AB 測試,SnowFlake 沒有,我們偏數據飛輪下面的輪子,偏數據資產和數據建設底層的部分,更強調兩個輪子兼備。
從業務需求來說先做應用,發現下一層可能有數據質量包括治理、資產的問題,再建下一個輪子,可以更靈活,更有選擇性一些,這是一個比較大的區别。
譚待:可以類比一個概念,叫 DevOps,以前 Dev 和 Ops 完全分開的,所以很割裂。其實數據裡面也有這個問題,你的應用和建設也是完全分開的,我們講數據飛輪有點像 DevOps,我要把數據應用和數據資產合在一起。
問:傳統企業想做數字化,或者一開始企業也注重數據,但是建設的不是特别好。如果這種情況下,希望能借助數據飛輪這個工具,會不會有一些摩擦力?
譚待:我們這些年也服務了很多所謂的傳統行業,像制造業、金融、零售等等都有。這幾年大家已經很重視數據建設,不是五年前或者七八年前大家覺得這事不是特别重要。
現在最大的挑戰是,建設完發現數據用不起來,因為建設過程中跟他的業務目标是脫離的,是有很多報表、很多系統,但是都用不起來。這也是我們為什麼提數據飛輪、數據消費的原因,得重新審視怎麼建這個事情,不然建再多的中台也沒用,這是這個階段我們需要改變的事情。
問:數據飛輪相比傳統企業數字化工具和數據中台的更新點到底在哪?
羅旋:最大的一點是看業務的痛點,第一步到底做什麼?傳統數據中台第一步是把數據建設好,數據資產弄好,到底有多少數據是一個相對整齊、統一、高質量地呈現出來。
數據飛輪,很大程度上先聊業務,業務上有什麼訴求,看數據可以在裡面起到多大作用,再看具體應該用什麼樣的解決方案,什麼樣的產品。
比如有客戶說我們做了小程式的頁面優化或者文案優化,他的業務痛點非常明确——通過文案的優化提高營銷的轉化率。相應地,我們提供的方案就是做 AB 測試。如果是另一種問題,比如說數據清洗、數據質量,我們可能需要提供數據資產管理、數據治理的工具,這是非常不一樣的。
傳統數據中台上來先不聊這些,先給你一個全家桶,先把這些做完。做完之後有什麼用?這些事當時沒有考慮,所以會遺留大量的工程後面推進不下去了,這是本質區别。
譚待:比如他已經投入了數據中台建設,他再用數據飛輪也是一個繼承關系,不需要全部推倒重來,這對于企業來說也是一個很好的方式,已有的投入也可以得到延續。
大模型的數據飛輪,有解嗎?
問:大模型時代,數據平台在火山的戰略定位有沒有發生變化?
譚待:我覺得數據平台更重要了,因為模型能夠降低使用門檻,更多人可以更容易地消費數據,生產和理解數據也更容易,對于數據平台來說重要性不言而喻。就像改良式的蒸汽機,對于下遊的原材料價值更高。
問:相比數據分析的數據飛輪,大模型廠商的數據飛輪很難建立。客戶都很看重數據資產,但是不願意把數據拿出來給模型廠商,怎麼看大模型公司自己的數據飛輪難以建立的問題?
譚待:比如說 A 公司用了大模型,但是全部都封閉在自己的體系,A 公司自己的數據飛輪是建起來了,對他是一個好事,但是大模型公司怎麼搞?最近 OpenAI 的 CEO 也有一個澄清,GPT 有沒有用用戶的數據。本身新的技術安全合規,信任是很重要的,肯定要在這個規範下做事情。
在實際中,有些用戶不願意那麼用,那就肯定不能用。但還有很多企業發現,用标準的東西不能完全解決我的問題,需要和底層的合作方(模型廠商)一起做優化,一起做優化的過程中自然而然就可以提升,數據飛輪就可以轉起來。
所以第一要合規,第二,在實際生活中有些人因為需求驅動導致很多企業願意和模型方共建,這種共建可以幫助雙方的數據飛輪都建立起來。
問:如何把用戶反饋的數據返回基礎模型,有什麼方法論嗎?
譚待:這個難點就是企業和用戶願不願意給第三方。(盡管)技術上也有一些難點,但是最大的難點是在意願上。
問:MaaS 平台推出幾個月了,也有自己的大模型,現在客戶選擇上選擇最多的是哪一款?
譚待:我覺得比較分散,不同的場景同時考慮效果、性價比,有的還有私有化部署的需求,不同模型在這方面的表現不一樣。
第二,相比全球最高水平,中國幾個基礎模型都有一定距離,現在大家更多還是在 POC(Proof of Concept,概念驗證,被視為發布功能性產品的第一步)、在做測試。真正有比較好的 AI 原生的應用出來的話,可能還是要等到底座模型本身至少具備 GPT3.5+ 以上水平,我覺得到年底這個事情才會更加清晰一些。
譚待介紹大模型時代數據飛輪的新趨勢|拍攝:極客公園
問:火山提到要全鏈路擁抱AI,具體如何系統布局,重點是什麼?
譚待:确實大模型本身能應用的範式比較廣泛,比如創作、内容、開發都有。其中數據分析是裡面非常重要的一個環節,所以我們今天主要是講我們數據分析產品上大概通過 AI 提供了哪些新的能力。其他的產品,我們在未來其他火山會議上也會逐步對外披露。
問:目前像字節内部對于大模型和AI業務資源傾斜的程度怎麼樣?在内部的權重如何?如何跟核心產品——抖音深度融合?
譚待:這次主要介紹的是數據產品的變化,大模型可以在 toB、toC 都有很大變化,你怎麼找到這個方向,哪些優化是有價值的,還是要回到數據驅動上。這也是我們在這個階段包括未來,數據產品很重要的原因,但是會通過模型本身讓數據產品使用門檻更低,能創造更多價值。
C 端的產品陸續可以看到一些變化,但是跟火山關系不會特别大。
問:現在大模型普遍有一個問題是對齊不太好,經常會有幻覺,給人誤導。火山有什麼比較獨到的經驗和方案?比如,AB 測試和數據方面,你們有沒有用這些方法來校準AI大模型?
羅旋:這确實是今天模型應用上一個非常大的阻塞點,在數據領網域這個點尤其突出,因為數據本身是要求精确的東西,不是一個主觀化的文本描述,不能是一個不精确或者錯誤的。
今天這個問題,整個行業都沒有徹底解決,但有一些方法能夠幫助我們一定程度上解決或者緩解這個問題。比如我們可以嘗試讓 AI 把它的思維過程、分析過程展示出來,一步步到底怎麼推理、怎麼想的。這個展示過程,人是可以看到的,當它出現錯誤時,我們是有可能發現這個錯誤的。
如果我們通過一些產品化的方式,能夠讓可能出現的錯誤比較顯性地呈現在用戶面前,讓他輕易改動之後就能拿到正确結果的話,這很大程度上還是可用的,這是我目前覺得最重要的思路。
另一方面模型能力本身的提升也會很大程度上緩解這個問題,以 OpenAI 為例,GPT-4 比 GPT-3.5 有巨大提升,所以我們期待随着模型能力的進一步提升也可以變好。
還有一個思路,可以在模型上做一些領網域的精調,在通用能力基礎上加一些領網域的知識,這也有利于幫助我們在具體的領網域裡面,讓這個幻覺變得更小,準确率更高。這些方法結合起來,很大程度上這個產品能力躍過一個門檻是真的可用的。
譚待:AB 測試确實很重要,AIGC 的東西也不是唯一的答案,你怎麼看(不同答案的)好壞,就像推薦一樣,AB 測試是非常重要的。我們現在看模型,你去評估各種榜單,可能意義不是那麼大,因為模型太大了,它可以把很多題目記下來,最終比較有用的還是通過 AB 測試來看,效果可能會比較好。