今天小編分享的科學經驗:2024年,百萬上下文依然沒有殺死RAG,歡迎閱讀。
每一次,當基礎模型能力變強,總會有人預言:RAG(檢索增強生成)或許要過時了。
但目前為止,每一次,這種預言都已落空。
比如今年 2 月,當第一批百萬上下文長度模型出現的時候,有人說 KV 緩存會取代 RAG。
後來大模型 Agent 突飛猛進的時候,又有人說 10 年就是以嵌入為基礎的 RAG 的最後期限。
10 年畢竟太遠,現在很難說得清楚。
但有 RAG 存在的未來,已經業内有不少人正在積極規劃:
產業界,英偉達等巨頭親自下場挖掘 RAG 價值。
學術界,最前沿領網域Agent 與 RAG 的結合,開始被越來越多的人探讨。
為什麼?
當大模型從實驗室走向工廠車間、企業辦公樓、教育課堂、金融後台、數據中心機房的那一刻,它需要的不止是語言理解與生成能力,還需要" 讀懂 " 企業内部海量而更新頻繁的數據資源。
訓練本身昂貴且緩慢,大模型本體無法頻繁更新,但企業知識與數據卻在日新月異。
RAG 正是企業數據接入大模型的數據樞紐,而将數據接入 AI 成為大模型時代最重要的事——
它幫助大模型實時獲取最新、最契合業務場景的知識,讓 AI 真正成為能幹活、有腦子的行業助手。
換句話說,是因為 RAG 正在各行各業為大模型落地掃清障礙。
這裡分别有教育、制造、金融行業的三位實踐者,來分享他們的 RAG 落地經驗。
教育業,需要靈活敏捷的知識迭代
先來看教育行業,特點是對知識更新迭代的需求尤其強烈。
在教育行業有個常見的場景:如教研資料、題庫、學科内容不斷變化,僅靠訓練底層模型難以與日新月異的教學信息同步。且學生提問較泛且不标準,傳統關鍵字檢索方案解決也行不通。
這時 RAG 成為低成本、高靈活性緩解大模型幻覺問題的最佳解決方案。
因此,行業通用做法就期望使用 RAG 開發框架打造智能助手,從而發揮海量課程、試題資源的數據價值,快速、準确地回答學生提問,提高在線教學效果,減少人力成本。
某教企最初嘗試過開源的 RAG 方案,然而卻發現其效果不佳,構建起來也繁瑣。
後來在騰訊雲團隊的幫助下,該教企客戶基于騰訊雲向量數據庫進行 RAG 方案的落地優化,他們終于實現了在復雜、多樣、動态知識庫中高效檢索。
過程中處理 "QA 對 " 數據的問題,給工程師留下深刻印象:
一開始語義分析的效果不是很好,經常會把多個 QA 對拆裂了,導致詢問 A 問題,得到 B 問題的答案。
後來與騰訊雲團隊後來讨論出解決方案,通過定制化邏輯修正文本拆分偏差,從而得到精準檢索結果。
這讓教企無需頻繁更新大模型本身,就能讓大模型實時取用最新教研資料,給用戶提供可信、更新及時的答案。
騰訊雲向量數據庫基于大量客戶有 RAG 應用開發的需求,還推出了 AI 套件功能:一站式文檔檢索解決方案,支持用戶直接上傳原始文檔,數分鍾内即可快速構建專屬知識庫,大幅提高知識接入效率。
在合作過程中,客戶也高度評價騰訊雲技術支持的快速響應與產品迭代能力,體現了其技術實力和靈活性。
過去可能需要幾十分鍾甚至上小時的查詢,如今只需秒級響應。
在教育場景中,RAG 與向量數據庫的結合,不僅提高檢索效率,更讓企業積累的教育資源充分釋放價值,為學生與老師帶來更高質量的智能化學習體驗。
制造業,需要标準化實現流程提效與人才培養
相比教育行業,制造業更顯復雜。
這裡有數量龐大的技術标準、設計資料、工程圖紙,還有多種多樣的文檔格式和數據來源,電子檔、掃描件、表格、圖片、CAD 文檔……
這些文檔往往分散在各個系統、部門和節點,查找、核對和更新成本高昂。工程師培養周期長達 3-5 年,技術标準不斷迭代,一旦出現生產問題,快速定位解決方案簡直是 " 大海撈針 "。
RAG 可以幫大模型整合行業知識,但首先要解決電器行業文檔多、内容復雜、圖文表混排的問題,不能只有向量數據庫和開發接口,還要整合端到端產品和服務。
騰訊雲大模型知識引擎,基于大語言模型的知識應用開發平台,提供知識問答、知識總結等應用模版及原子能力,助力企業低門檻構建企業級知識服務。讓大模型能夠回答較為普世的問題,如服務于垂直專業領網域,會存在知識深度和時效性不足的問題。
騰訊雲大模型知識引擎幫助萬榕信息打造了從原始文檔中迅速獲取标準和最佳實踐,工程師不再耗費半天去翻閱标準合同、設計資料,而是幾分鍾内就能定位信息;碰到南網高海拔產品設計标準、斷路器事故處理等棘手問題,AI 助手根據 RAG 動态檢索企業内部知識庫、歸納處理意見,并生成報告初稿。
過去的流程極度依賴資深工程師的個人經驗,如今 RAG 讓知識得以系統化傳承、動态更新和快速分享。這不僅縮短了新人工程師的上手周期(從 1.5 年縮短至 6-8 個月),還直接提升了整體工作效率(在人員不變的情況下,目标是提高 40% 的效率)。
RAG 在制造業中帶來的,是效率、成本和人才培育模式的全方位革新。
金融業,要提效、要敏捷,但更重要是安全!
金融科技是一個極其注重合規、安全與隐私的行業。
招商證券作為金融行業的龍頭企業,正全面擁抱 AI,自上而下地推進數字化轉型。他們将 "AI 編程助手 " 作為 AI 技術應用的重要切入點,主要原因在于:
技術成熟度:AI 編程場景足夠成熟,解決了研發人員在日常開發中的效率問題。
明确的業務價值:AI 工具的引入可以快速帶來效率提升,收益顯著且可量化。
在這樣的背景下,簡單的 RAG 方案遠不足以滿足需求,需要大模型、產品、基礎設施等全面整合,提供私有化部署的解決方案。
騰訊雲 AI 代碼助手提供產品基礎能力及開放式架構,為招商證券打造智能化金融科技研發工具。
騰訊雲基于内部經驗開發 AI 代碼助手,通過插件形式解決開發痛點,為企業和團隊提供效率提升的解決方案,同時注重靈活部署與行業需求适配
依托騰訊雲的技術方案,招商證券實現了工具集成、數據安全和隐私保護,解決了金融業在 AI 應用落地中 " 好用不好管 " 的難題,讓 AI 代碼助手切實提高研發效率,滿足日益增長的業務和監管要求。
雙方的合作甚至深入到產品之外:在推廣 AI 代碼助手的過程中,招商證券與騰訊雲都面臨了技術變革與習慣轉型的挑戰。
參考騰訊雲内部推廣 AI 代碼助手的經驗,招商證券的推廣分為兩個階段:第一階段通過主動推廣取得了初步成效;第二階段打造體系化的推廣運營機制,實現開發者自發地接受并使用 AI 工具。
目前,招商證券已有千餘名開發人員使用 AI 代碼助手,日活躍人數達 300,代碼采納率接近 20%。
招商證券希望 AI 代碼助手能夠擴展到更多垂直領網域,如量化交易、模型定價、分析師等業務人員,覆蓋更廣泛的代碼應用場景。
為什麼是騰訊雲?
其實,上面三個案例均來自 AICon 全球人工智能大會《Techo Day-RAG 應用與實踐》專場。各行業技術大咖們,現場交流分享了探索 RAG 在解決大模型幻覺中的創新策略與實戰經驗。
我們注意到,這些行業成功案例的背後都有身影同一個身影,騰訊雲。
比如前面某教企分享過的業務初期嘗試開源方案未果,轉而與騰訊雲團隊合作解決了語義分析中的問題拆分錯誤的等難題。
但為什麼是騰訊雲?
為了回答這個問題,我們也請到了騰訊雲數據庫副總經理羅雲分享他的觀點:
一是長期技術積累和内部驗證。
騰訊雲向量數據庫并在騰訊内部已廣泛應用,包括騰訊視頻的版權與合規檢索等苛刻場景中早已成熟運轉。
自 2019 年持續研發,為滿足深度神經網絡和向量檢索融合的業務需求,騰訊雲不斷打磨向量數據庫,并在實踐中推動存儲與計算分離架構的落地。
這些技術與經驗讓騰訊雲能夠在面對多樣化、復雜化的客戶需求時快速響應、持續改進。
二是豐富的服務生态與快速迭代能力。
某教企在實現車輛安全相關 QA 問題時,需要定制化處理拆分邏輯——騰訊雲團隊快速介入、靈活解決。
萬榕信息需要處理從标準文檔到掃描件的多模态數據,騰訊雲知識引擎也能給出針對性解決方案。
對于招商證券這種高度合規與高定制的場景,騰訊雲則提供從基礎數據庫、到私有化部署與產品級能力的一整套方案。
總結起來就是,這樣的穩定性與靈活性的并存的 RAG 能力,在大模型加速落地的關鍵階段尤為寶貴。
未來,随着產業對 AI 的要求不斷更新,RAG 本身也将持續演進。技術創新會進一步提高檢索效率、提升多模态數據處理能力、降低用戶使用門檻;更多場景将在 RAG 的賦能下實現智能化轉型。
因此,當下質疑 RAG 過時為時尚早。RAG 不僅不會消亡,反而将伴随大模型技術的深度落地而愈發重要。
在下一階段的 AI 競争中,誰能讓大模型 " 用得起來 "、數據 " 用得其所 "、業務 " 跑得更快 ",誰就能在產業智能的浪潮中占得先機。
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>