大模型時代，「數據飛輪」怎麼做？

今天小編分享的科技經驗：大模型時代，「數據飛輪」怎麼做？，歡迎閱讀。

數據飛輪，是今年大模型帶火的一個典型詞匯，通過客戶在應用程式中輸入的提示詞這樣的數據反饋，使大模型快速迭代。今年初，數據飛輪也曾一度被視為 OpenAI 最重要的先發優勢。

但在 All in 大模型的下半年，數據飛輪成為了大模型廠商最頭疼的事情。此前在極客公園舉辦的一場大模型研讨會中，不少創業者表示，「用戶都看重數據資產，不願意把數據拿出來，模型廠商幫助客戶訓好模型，做本地部署，做完了『淨身出戶』，數據飛輪很難建立起來」。

從 A/B 測試裡跑出來的今日頭條，基于數據分析選品、調度的抖音直播，火山引擎數據平台擁有這兩個互聯網最豔羨的業務實踐，火山引擎如何看待大模型的數據飛輪問題？

帶着這樣的好奇，極客公園在 9 月 19 日 V-Tech 數據驅動科技峰會上，采訪了火山引擎總裁譚待。他表示，大模型的數據飛輪問題首先要合規，其次，很多企業願意與模型廠商共創，從而可以讓大模型廠商的大模型數據飛輪轉起來。

火山引擎 V-Tech 數據驅動科技峰會｜來源：火山引擎

另一方面，在數據平台的產品層面，火山有更多的數據飛輪實踐。

峰會上，譚待和字節跳動數據平台負責人羅旋，介紹了火山引擎在數據平台層面接入的大模型功能探索。其中，在類 BI（Business Intelligence，商業智能）產品、自動駕駛艙等產品中引入了 AI 助手；在數據管理產品中引入了 AI 自動補全代碼和修正代碼等功能；目前，相關數據產品已啟動邀測。據悉，這幾款產品的AIGC功能背後，是基于火山自己的大模型——雲雀（目前在内測中）。上個月底，雲雀大模型通過了《生成式人工智能服務管理暫行辦法》備案。

事實上，大模型在數據類產品的落地，還有一定距離。

6 月以來，不少數據產品都引入了 AI 助手這樣的功能，目前產業界普遍仍在打磨落地中，要實現任何自然語言精準「召喚」出想要的數據形式，還需要幾年的探索時間。火山引擎總裁譚待也表示，真正有比較好的 AI 原生應用出來，可能要等到底座模型本身至少具備GPT3.5+ 以上水平，才會清晰一些。

但在理念上，火山引擎提出了不同的數據飛輪理念，數據驅動最終是一定要落在企業不同人員對數據的消費上，以此來建設數據產品，把數據「推」到最廣泛的數據消費者面前，最終形成基于數據分析的一致行動。這能解決近年來飽受争議的數據中台難落地的問題。

關于上述問題，譚待和羅旋接受了包括極客公園的采訪，以下是對話節選：

數據，必須被「消費」

問：峰會上推出的找數助手、開發助手、分析助手幾款工具，用戶會以什麼樣的方式獲取這些服務？

羅旋：因為 AI 本身也在快速發展過程中，產品經過一段實踐，不能算是成熟的狀态，我們希望一點點逐漸打磨產品。前期先邀測，不會大規模放開，希望有一些客戶能夠深度跟我們共創，更成熟以後，再大規模對外公開。

問：這些AI助手用了什麼大模型？

羅旋：我們現在主要依賴于字節本身有一個雲雀大模型，以及火山方舟 MaaS 平台上有一些合作夥伴的大模型。

問：怎麼理解「以消費為核心」的數據驅動？

譚待：回到最大的根本，做這件事情，還是希望把目标定清楚，最後其實是以數據消費為目标來做這個事情。跟過去五六年業界講的數據中台的概念相比，這是一個更大的更新，而且是更有效解決企業數據產生價值的問題。

否則，很多企業投入大量的資源，建完之後有數據，但是沒有利用起來，本質就是沒有想清楚最終應該圍繞什麼來做這件事情。以前我們做建設的時候，目标是有偏差的，比如我建一個中台其實不是目标，是實現數據驅動的一個手段。

所以我們提出了數據消費、數據飛輪這樣的邏輯。企業建設數據時，應該把數據消費作為目标，比如峰會講的兩個 80%：一是 80% 的企業員工能夠用到，二是能覆蓋到 80% 的分析場景。

圍繞數據消費，我們的體系叫數據飛輪，數據飛輪上層是跟應用相關，這些產品裡面大部分确實是 SaaS 的形态，也有一些會是 PaaS 的形态。下一層是數據資產的建設，這些主要是 PaaS 為主，通過數據消費這個事情端到端應用起來，就能解決過去企業數據建設過程中，數據團隊和業務團隊互相不理解導致最後效果不好的問題。

火山引擎全套數據平台產品｜拍攝：極客公園

問：火山引擎一整套數據飛輪的產品，如果跟 SnowFlake 相比的話，有哪些相同的地方，有哪些不同的地方？

羅旋：SnowFlake 本質上更多是數倉的引擎，公司做大以後也嘗試着往更多數據分析這邊去走，但是更多是從基礎層的引擎往上做。

我們切入的角度不一樣，我們更強調業務，比如 AB 測試，SnowFlake 沒有，我們偏數據飛輪下面的輪子，偏數據資產和數據建設底層的部分，更強調兩個輪子兼備。

從業務需求來說先做應用，發現下一層可能有數據質量包括治理、資產的問題，再建下一個輪子，可以更靈活，更有選擇性一些，這是一個比較大的區别。

譚待：可以類比一個概念，叫 DevOps，以前 Dev 和 Ops 完全分開的，所以很割裂。其實數據裡面也有這個問題，你的應用和建設也是完全分開的，我們講數據飛輪有點像 DevOps，我要把數據應用和數據資產合在一起。

問：傳統企業想做數字化，或者一開始企業也注重數據，但是建設的不是特别好。如果這種情況下，希望能借助數據飛輪這個工具，會不會有一些摩擦力？

譚待：我們這些年也服務了很多所謂的傳統行業，像制造業、金融、零售等等都有。這幾年大家已經很重視數據建設，不是五年前或者七八年前大家覺得這事不是特别重要。

現在最大的挑戰是，建設完發現數據用不起來，因為建設過程中跟他的業務目标是脫離的，是有很多報表、很多系統，但是都用不起來。這也是我們為什麼提數據飛輪、數據消費的原因，得重新審視怎麼建這個事情，不然建再多的中台也沒用，這是這個階段我們需要改變的事情。

問：數據飛輪相比傳統企業數字化工具和數據中台的更新點到底在哪？

羅旋：最大的一點是看業務的痛點，第一步到底做什麼？傳統數據中台第一步是把數據建設好，數據資產弄好，到底有多少數據是一個相對整齊、統一、高質量地呈現出來。

數據飛輪，很大程度上先聊業務，業務上有什麼訴求，看數據可以在裡面起到多大作用，再看具體應該用什麼樣的解決方案，什麼樣的產品。

比如有客戶說我們做了小程式的頁面優化或者文案優化，他的業務痛點非常明确——通過文案的優化提高營銷的轉化率。相應地，我們提供的方案就是做 AB 測試。如果是另一種問題，比如說數據清洗、數據質量，我們可能需要提供數據資產管理、數據治理的工具，這是非常不一樣的。

傳統數據中台上來先不聊這些，先給你一個全家桶，先把這些做完。做完之後有什麼用？這些事當時沒有考慮，所以會遺留大量的工程後面推進不下去了，這是本質區别。

譚待：比如他已經投入了數據中台建設，他再用數據飛輪也是一個繼承關系，不需要全部推倒重來，這對于企業來說也是一個很好的方式，已有的投入也可以得到延續。

大模型的數據飛輪，有解嗎？

問：大模型時代，數據平台在火山的戰略定位有沒有發生變化？

譚待：我覺得數據平台更重要了，因為模型能夠降低使用門檻，更多人可以更容易地消費數據，生產和理解數據也更容易，對于數據平台來說重要性不言而喻。就像改良式的蒸汽機，對于下遊的原材料價值更高。

問：相比數據分析的數據飛輪，大模型廠商的數據飛輪很難建立。客戶都很看重數據資產，但是不願意把數據拿出來給模型廠商，怎麼看大模型公司自己的數據飛輪難以建立的問題？

譚待：比如說 A 公司用了大模型，但是全部都封閉在自己的體系，A 公司自己的數據飛輪是建起來了，對他是一個好事，但是大模型公司怎麼搞？最近 OpenAI 的 CEO 也有一個澄清，GPT 有沒有用用戶的數據。本身新的技術安全合規，信任是很重要的，肯定要在這個規範下做事情。

在實際中，有些用戶不願意那麼用，那就肯定不能用。但還有很多企業發現，用标準的東西不能完全解決我的問題，需要和底層的合作方（模型廠商）一起做優化，一起做優化的過程中自然而然就可以提升，數據飛輪就可以轉起來。

所以第一要合規，第二，在實際生活中有些人因為需求驅動導致很多企業願意和模型方共建，這種共建可以幫助雙方的數據飛輪都建立起來。

問：如何把用戶反饋的數據返回基礎模型，有什麼方法論嗎？

譚待：這個難點就是企業和用戶願不願意給第三方。（盡管）技術上也有一些難點，但是最大的難點是在意願上。

問：MaaS 平台推出幾個月了，也有自己的大模型，現在客戶選擇上選擇最多的是哪一款？

譚待：我覺得比較分散，不同的場景同時考慮效果、性價比，有的還有私有化部署的需求，不同模型在這方面的表現不一樣。

第二，相比全球最高水平，中國幾個基礎模型都有一定距離，現在大家更多還是在 POC（Proof of Concept，概念驗證，被視為發布功能性產品的第一步）、在做測試。真正有比較好的 AI 原生的應用出來的話，可能還是要等到底座模型本身至少具備 GPT3.5+ 以上水平，我覺得到年底這個事情才會更加清晰一些。

譚待介紹大模型時代數據飛輪的新趨勢｜拍攝：極客公園

問：火山提到要全鏈路擁抱AI，具體如何系統布局，重點是什麼？

譚待：确實大模型本身能應用的範式比較廣泛，比如創作、内容、開發都有。其中數據分析是裡面非常重要的一個環節，所以我們今天主要是講我們數據分析產品上大概通過 AI 提供了哪些新的能力。其他的產品，我們在未來其他火山會議上也會逐步對外披露。

問：目前像字節内部對于大模型和AI業務資源傾斜的程度怎麼樣？在内部的權重如何？如何跟核心產品——抖音深度融合？

譚待：這次主要介紹的是數據產品的變化，大模型可以在 toB、toC 都有很大變化，你怎麼找到這個方向，哪些優化是有價值的，還是要回到數據驅動上。這也是我們在這個階段包括未來，數據產品很重要的原因，但是會通過模型本身讓數據產品使用門檻更低，能創造更多價值。

C 端的產品陸續可以看到一些變化，但是跟火山關系不會特别大。

問：現在大模型普遍有一個問題是對齊不太好，經常會有幻覺，給人誤導。火山有什麼比較獨到的經驗和方案？比如，AB 測試和數據方面，你們有沒有用這些方法來校準AI大模型？

羅旋：這确實是今天模型應用上一個非常大的阻塞點，在數據領網域這個點尤其突出，因為數據本身是要求精确的東西，不是一個主觀化的文本描述，不能是一個不精确或者錯誤的。

今天這個問題，整個行業都沒有徹底解決，但有一些方法能夠幫助我們一定程度上解決或者緩解這個問題。比如我們可以嘗試讓 AI 把它的思維過程、分析過程展示出來，一步步到底怎麼推理、怎麼想的。這個展示過程，人是可以看到的，當它出現錯誤時，我們是有可能發現這個錯誤的。

如果我們通過一些產品化的方式，能夠讓可能出現的錯誤比較顯性地呈現在用戶面前，讓他輕易改動之後就能拿到正确結果的話，這很大程度上還是可用的，這是我目前覺得最重要的思路。

另一方面模型能力本身的提升也會很大程度上緩解這個問題，以 OpenAI 為例，GPT-4 比 GPT-3.5 有巨大提升，所以我們期待随着模型能力的進一步提升也可以變好。

還有一個思路，可以在模型上做一些領網域的精調，在通用能力基礎上加一些領網域的知識，這也有利于幫助我們在具體的領網域裡面，讓這個幻覺變得更小，準确率更高。這些方法結合起來，很大程度上這個產品能力躍過一個門檻是真的可用的。

譚待：AB 測試确實很重要，AIGC 的東西也不是唯一的答案，你怎麼看（不同答案的）好壞，就像推薦一樣，AB 測試是非常重要的。我們現在看模型，你去評估各種榜單，可能意義不是那麼大，因為模型太大了，它可以把很多題目記下來，最終比較有用的還是通過 AB 測試來看，效果可能會比較好。