今天小編分享的互聯網經驗:商業智能的AI奇點:沿着舊地圖,找不到新大陸,歡迎閲讀。
圖片來源 @視覺中國
文|光錐智能,作者|劉雨琦,編輯|王一粟
" 今年 8 月份以後,有非常多企業客户開始咨詢智能化的服務,也提出一起共創。"ChatGPT 火爆之後的半年,帆軟 BI 產品運營負責人唐昕開始感受到了來自市場對智能 BI 的強烈需求。
商業智能 BI 是一套完整的由數據倉庫、查詢報表、數據分析等組成的數據類技術解決方案。越來越多的企業也意識到 BI 的重要性,據 Gartner 2023 年在中國區進行的調研表示:62% 的中國 CIO 将在 2023 年增加商業智能 BI 的投資。
從報表式 BI 到敏捷式 BI,中國 BI 經歷過第一波周期,走向低門檻、可視化,讓業務人員能夠快速托拉拽自定義用數,同時也将後端分析能力搬到台前。
在光錐智能與多位 BI 廠商交談的過程中發現,幾乎所有業内人士都認為,智能 BI 是下一個階段。但從具體動作來看,目前廠商的态度卻大概分為兩派:
一派是行動派, 在 ChatGPT 出現以後,迅速接入能力開始嘗試,如思邁特新版本中着重提到了智能對話能力,網易數帆也在押注 ChatBI、百度 GBI 在内的巨頭公司也開始向智能 BI 進行探索和嘗試;
另一派則是冷靜派, 仍然在保持觀望态度和内部探索,并沒有迅速上線產品。
" 沿着舊地圖,找不到新大陸。" 思邁特軟體 CEO 吳華夫認為發展智能 BI 不破不立;網易數帆大模型技術負責人、人工智能產品線總經理胡光龍同樣認為:" 智能化将極大降低 BI 用户使用門檻,真正做到人人用數的階段。"
但帆軟 FineBI 產品運營總監唐興強卻認為:" 智能化對 BI 的影響更多在提升效率的環節,核心還是要結合當下場景進一步分析。"
在如同冰與火的對立之下,中國 BI 行業也在争議中,再次進化。
智能 BI 長什麼樣?
智能化席卷着千行百業,但究竟會帶來哪些具體的改變,任何一個行業都還沒有定論。
" 大模型+BI,從互動式體驗,到編碼能力再到推理能力,要一層層疊加到業務裏去 ",網易數帆大數據產品線總經理餘利華向光錐智能分享道。
用互動式能力降低 " 用數 " 門檻,是智能化的第一階段。
從微軟 PoweBI 開始,對話式 BI 成了大模型+BI 的第一站。國内 BI 廠商也在今年 8 月開始動了起來。
思邁特在最新 V11 版本的產品中,加入了數據模型、指标模型、自助分析、對話式分析等多種智能角色能力,另據光錐智能獨家獲悉,思邁特不久也将推出問答式 BI;緊接着網易數帆發布了有數 ChatBI 產品,将基于大模型的自然語言理解能力與專業數據分析能力結合;10 月份,押注 AI 應用的百度也将觸角延伸至 BI 領網域,推出其生成式商業智能產品 " 百度 GBI",可以通過自然語言互動,執行數據查詢與分析任務,并且支持專業知識注入。
對話式 BI,即用户通過自然語言即可與 BI 系統進行互動。當對話式 BI 介入後,查找數據的流程被簡化為,自然語言詢問—自動轉化為 SQL 語言—自動搜索數據—轉化為自然語言—輸出結果。
這種互動方式最大的特點在于大幅度地降低了 BI 系統的使用門檻,讓業務人員無需掌握 SQL 等專業語言,也無需深入分析模型,即可獲得所需。
但随着企業深度使用體驗,對話式 BI 即問題也暴露無遺。例如,搜索過程中,出現了多次搜索數據結果不一樣;因統計口徑不一致,指向同一個指标的數據無法合并同類項,導致了 GMV 無法與成交金額一起納入統計。
諸如此類問題,在實際應用中層出不窮,也逐漸讓企業意識到:對話也只是一種形式,而非一種結果。單純的搜索并不能保證數據得出的合理性,要防止數據變成 " 無源之水 ",還得增加分析的過程。
于是,用推理能力打破分析壁壘,開啓了智能化的第二階段。
智能分析簡單來説,就是 BI 系統能主動識别問題,進行根本原因分析,并給出解決方案建議。這背後需要 BI 系統積累大量的領網域知識及復雜推理能力。以愛數為代表的部分廠商,正在發力知識圖譜和大模型,朝這個方向嘗試。
愛數產品副總裁李基亮告訴光錐智能," 只有通過知識的方式,才能在技術上做關聯分析。"
比如當數據統計口徑不一致時,需要大模型的理解能力理解相近意思的數據,并進行整理和歸類。舉個簡單的例子:統計公司本科以上的員工,這不是關鍵詞的篩選而是理解本科、碩士、博士三種具體的學位。
而在分析層,傳統的 BI 軟體能夠顯示數據異常的波動,比如 10 月份銷量低迷,智能分析能夠通過回歸分析模型,對于每一步的數據搜索、分析過程清晰可見,結果歸因層層下鑽,逐一拆解,再通過 ChatBI 展示影響因素是品牌、客户還是渠道。
再向前展望一步,通過智能體重塑 BI 系統,或許是智能化的第三階段。
Agent 概念最近大火,未來,也許可以達到萬物皆可 Agent 的狀态,BI+Agent 也将成為其中一個細分方向。
以光錐智能觀察,Agent 對 BI 行業的改造已經開始,有從業者告訴我們:"BI 目前是 Agent 化改造的第一梯隊 ",究其原因在于 BI 系統裏本身就含有大量需要自動化的步驟和流程,這與初級階段的 Agent 十分适配,既能簡化流程,提升效率,還能提升調用大模型的基礎能力。
未來,更進一步,當 Agent 變得更聰明後,一切過程化将被 Agent 内化為己有。到那時,無論是單智能體還是多智能體都将不在依賴于線性的程式和規劃,對 BI 行業帶來的結果可能是,系統的界限被打破,服務模型将被重構。
Agent 直接與用户產生互動,用户通過語音或文字,描述業務問題,大模型理解問題場景,自動識别相關數據源,進行分析并輸出結果,完全無需搭建 BI 系統。
這種 "BI+Agent" 的新模式,也被業内的一些人視為可能的終點狀态。
智能化,為時尚早麼?
大模型蒙眼狂奔了一年,也讓行業看清了一個現實 " 智能化不是萬能解藥 ",甚至現在很多行業數字化水平都尚淺,從根本上缺少智能化的基礎。
唐昕表示:" 智能化對 BI 的影響更多在提升效率的環節,核心還是要結合當下場景進一步分析。"
這一思路和網易不謀而和,網易數帆大數據產品線總經理餘利華認為:" 如果 BI 僅僅疊加了大模型,但不能落地、沒有場景,就沒有價值。"
反觀當下 BI 行業所面臨的痛點,并不僅僅是技術難題,簡單的講,并不是智能化缺乏落地場景,而是整個 BI 行業都面臨着場景落地的階段性難題。
不少客户反饋,大模型生成的分析代碼質量參差不齊,準确率難以保證。帆軟表示,這就要求 BI 廠商對領網域場景有足夠理解,進行細致調教。否則用户體驗反彈,信任難以建立。
如何理解場景?唐昕舉了一個例子,BI 軟體具體應該形成什麼樣的指标,如何能讓業務用起來,如何分析產生數據價值,都需要深入行業梳理。
以制造業為例,在制造業裏 " 不良率 " 是一個重要指标,那麼 BI 介入之後,首先,需要根據行業認知,去确定 " 不良率 " 的特征标準,然後才可以把這一特征揪出來,放到指标庫裏,通過标準化產品實現復用。
在這一階段,BI 性能越高就能行業通吃,這就需要把行業經驗吃透,沉澱出指标來。畢竟,金融級的 BI 要求的是數據敏感,而制造業就不要敏感、需要穩定,行業的經驗往往不能照搬遷移。
因此,對于所有 BI 企業而言,在進入一個新行業之時,企業們又回到了相似的起跑線上。
從行業開拓的角度來看,BI 企業開始步入新一輪探索階段,尋求其他更復雜更邊緣行業的落地機會。
BI 發展多年以來,率先在金融、電商、零售等行業落地。例如,網易數帆基于金融機構面臨的監管加強、價值體現難、數據質量不足、開發資源緊張等挑戰,對于金融機構進行數字化建設,包括數據生產力的提升,其内涵涉及合規、增值(為管理、運營人員等提供即開即用的數據)、可信(業務人員信得過數據及平台,打破數據壁壘)、協同等。
在舒适區探索趨近于飽和之後,BI 行業正在向外探索,例如農業、制造業等數字化程度較低、專業性的行業,成為了下一個階段 BI 探索與争奪的目标。
而在解決這些痛點難題之後,智能化更多的作用集中在 " 輔助 " 和 " 增強 " 的環節。以愛數客户為例,他們在大模型等支持下解決了數據标準化、業務術語統一等問題,從而提升下遊分析建模效率達 30% 以上。
不過," 智能化 " 也并非開挂。
盡管市場上已經出現了各種智能 BI 的概念與嘗試,大到行業領導者,小到新晉創業團隊。但產品落地後,用户普遍反映智能化的效果并不盡如人意。原因在于,智能 BI 并不是簡單架接一個通用型大模型即可高效運轉。
未來中國 BI,智能化只是其中一個可能路徑。但必須要強調的是,目前無論是國外 PowerBI 還是國内的諸多 BI 廠商的調研來看,客户對于智能化的需求并不強,多半抱着獵奇的心态,感興趣但不會真的為其買單。
更為關鍵的是如何從客户場景、行業痛點中汲取經驗教訓。這是中國 BI 企業在新一輪應用探索中必須面對的選擇。
要求數據能力更高,行業重新洗牌
智能化雖然不是開挂,但也确實激活了相對固定的行業格局。最為典型的特點便是今年以來,老選手們奮力創新,新選手們也在排隊入場。
不止百度這種大廠開始發力 GBI ( 生成式商業智能產品),SaaS 廠商開始下探 PaaS 層,數據庫企業也基于 AP 的分析能力對外向企業提供 BI 服務,一時間,BI 成了數據產業鏈的交叉點,整個行業格局也面臨着重新洗牌。
智能化對數據能力要求的進一步提升,讓更底層的數據廠商積累的能力,得以在大模型時代釋放。比如,針對大模型在產業中落地存在着數據層的關鍵難題——幻覺問題、不可解釋性、安全風險等等,愛數方面認為,這并不是大模型的問題,而是數據問題。
數據廠商的基礎能力,也是 BI 智能化的下一階段所需要的核心能力。
比如,企業中常年存在的 " 數據孤島 " 問題,無法實現數據的有效連接和統一查詢利用。而且,多個系統中存在重復和冗餘的數據,造成存儲和計算資源浪費。同一數據在不同系統中存在不一致版本,數據質量無法有效控制。
這會嚴重影響分析結果和準确性,這不是上一個系統、換一個工具、買一些 SaaS 產品局部診脈就能解決的問題,企業需要系統性的、全局性的 BI 產品。
為了打通多種數據源,愛數在數據管道、數據湖倉一體方面進行了探索,也将這樣的探索應用在了 RGA(檢索增強)技術中,在大語言模型推理生成答案時,額外檢索調用外部的領網域知識網絡,利用綜合檢索結果進行答案生成。
而智能化產生的新需求對底層的數據能力提出了挑戰,這正是全鏈條工具儲備的一個新牽引力。
李基亮舉了一個很現實的例子:" 現在我們很多客户都是幾百 TB 以上的數據,那平台的搜索能力、對元數據的備份能力、對勒索病毒的抵抗能力,這些很基礎的平台能力如果沒有,那建好了分析也是空中樓閣。"
" 所以現在不是 AI+Data,而是 Data+AI。" 李基亮強調。
雖然基礎工作繁瑣,當智能分析一旦跑通,将成為新的生產力方式。
企業服務往往靠的是經驗型產品和服務,行業格局也會更依賴于先發優勢和客户突破能力,也正是因此,短時間内,後來者很難颠覆帆軟 Top1 的地位。
智能化作為生產力之後,客户的選擇更多,也可以通過智能化把需求重新做一遍,這讓行業有一個了新的彎道超車的機遇期,甚至像百度這種基本沒有涉足過 BI 行業的大廠,也能通過一些 AI 原生的能力切入中小企業,滿足不同群體的不同訴求。
智能化為 BI 開啓了一扇新的視窗,同時,也将帶着廠商走入新的競争格局。