今天小編分享的科學經驗:百度交流會大玩心跳!現場實時調教大模型,炸出背後更強底座文心千帆,歡迎閱讀。
大模型評價标準,現在到了被擺上台面讨論的時刻。
過去兩個月," 百模大戰 " 吸足了外界眼球,大模型越發越多,但到底什麼樣的大模型才是好大模型,卻也越來越眾說紛纭、備受關注。
就在這樣的時間節點,國内最早内測生成式 AI 大模型的百度,一波新的技術動作,迅速在線下引發熱烈反響:
5 月 9 日的百度智能雲的文心大模型技術交流活動現場,文心一言先是化身 " 文心問數 ",秀了一把分分鍾數據可視化的能力。
但下一分鍾," 出 bug" 的一幕就給逮住了:在面對畫折線圖的需求時,文心一言壓根沒懂,來了一句 " 換個問題試試 "。
這是上演直播事故了?台上的程式員小哥,卻十分淡定,随即調出了一個新界面——文心千帆大模型平台。
結果下一步操作,直接讓現場觀眾紛紛舉起手機錄像:現!場!微!調!大!模!型!
只見他當場新建了一個微調數據集。
導入的是這樣一份數量在100 條左右的标注數據。
一通可視化操作下來,不過10 幾分鍾之後,當文心一言再次被要求:
華北地區 2019 年 3 月的銷售額,用折線圖表示。
它就已經完全不糊塗,能快速給出正确的結果了。
不錯," 現場調教 ",恰恰是這一次技術交流活動中,文心一言最受關注的更新重頭戲。
因為這就意味着,在百度圍繞文心一言搭建起的工具鏈中,僅需少量數據,最快幾分鍾,大模型就能完成一次 " 定制化 ",這也是國内第一個現場演示如何微調行業專屬大模型的全過程。
更重要的是,通過已在内測中的文心千帆大模型平台,這樣的訓練調優經驗和技術,已經可以向第三方輸出了。
于是,回到一開始那個問題上,什麼樣的大模型才是好大模型?大模型背後正在被改寫規則的雲計算,又該用何種新标準去評價?
至少現在,讨論的範圍中,是時候考慮加進新的樣本範例了。
文心千帆是什麼?
先來研究研究,這個 " 文心千帆大模型平台 ",與文心一言具體是個什麼關系?
簡單來說,在文心千帆大模型平台上,企業用戶可以直接用上文心一言的大模型服務,不過與此同時,也可以基于這個平台,訓練、調優任何第三方大模型,打造屬于自己的大模型。
作為全球首個一站式企業級大模型平台,文心千帆所能提供的,實際上不僅是大模型本身,更是開發大模型的一整套工具鏈和環境。
還是結合具體案例來看看,文心千帆具體能用來做什麼。
首先,是公有雲服務。主要包括三個組成部分:
1、推理,就是直接調用大模型的推理能力。
以百度員工 " 内用 " 的智能辦公軟體如流為例,其中就接入了一個可以直接向文心一言提問的 AI 小助手。
平時無論是程式員還是產品經理,手頭上的項目都有不少,遇到問題時往往需要私戳對應的負責人,光是等待時間就接近 5 分鍾。
現在有了 AI 助手,如流不僅能直接模拟同事身份,幫助回答一些專業問題,還能從項目檔案中提取關鍵信息來答疑解惑。
而且,平均應答時間只需 5 秒鍾,比同事快了 60 倍。
這樣看,哪天身邊的同事被 AI 替代了,可能百度員工都不知道(手動狗頭)
2、微調,通過少量高質量的精标業務數據,高效訓練出特定行業大模型。前文提到的文心一言現場微調,就是基于這一服務實現的。
3、托管,即把訓好的模型,發布到百度智能雲上,由百度智能雲來對模型進行運營維護。企業同樣只需考慮如何用好模型,而無需顧慮復雜的部署和管理問題。
百度集團副總裁侯震宇談到,盡管當前,從頭訓練大模型的成本仍然高昂,但使用、微調大模型的成本已經在過去幾個月中,有顯著降低。
比如,現在調用文心一言的成本,已經降低到模型剛發布時(3 月 16 日)的 10%。
也就是說,通過文心千帆的公有雲服務,用戶可以直接服用百度智能雲過去積累下的開發、應用大模型的經驗,更低成本、低門檻地用上大模型。
公有雲服務之外,文心千帆也支持私有化部署。同樣包括三個方面:
軟體授權,即在企業本地環境中,提供文心一言的大模型服務。
軟硬一體,提供整套大模型服務及對應的硬體基礎設施。
租賃服務。提供機器和平台租賃,以滿足客戶的低頻需求。
以金山辦公為例,他們認為,當前市面上的文檔產品,無論是傳統的還是流式的,都是基于人們的創作,用自己的筆一行一行把想要的東西表達出來。
這就需要重新思考,AI 時代,創作的過程該是什麼樣子?
金山辦公選擇的策略是," 要跟中國優秀的大模型提供方站在一起,做好大模型應用方的角色,用更好的辦公軟體,為客戶提供更多的價值 ",于是在綜合考慮安全合規、模型深度、迭代速度、推理性能等多個方面的優勢後,金山辦公 pick 了文心千帆。
據透露,在意圖理解、PPT 大綱生成、範文書寫、生成待辦列表、文生圖等多模态生成的場景上,雙方的聯合開發已經取得了進展,但在細節方面仍然會自己進一步調試。
說不定不久後,我們就能在 WPS Office 上和基于文心千帆大模型平台打造的 AI 小助手對話了。
相比于公有雲服務,私有化部署能滿足更嚴格的數據監管需求。
總結一下就是,文心千帆能通過圖形化的界面,提供 AI 算力,數據管理、模型訓練、評估優化、服務部署等大模型生產開發全流程的工具鏈。除了開發,文心千帆還為客戶提供了非常好的大模型訓練推理服務。
有意思的一點是,百度智能雲 AI 與大數據平台總經理忻舟提到," 快且收斂,是大模型應用訓練中一個非常重要的指标,只快不收斂,大模型的訓練是沒有用的。"
基于文心千帆大模型平台 + 百度 AI 大底座的能力,像 Bloom、LLaMA、GLM 等千億級第三方開源模型,分布式并行訓練的性能提升平均也都能達到 150%。
新時代需要新的評價标準
事實上,如果進一步探尋大模型技術進展背後,來自產業端的需求變化,就會發現文心千帆所折射出的,其實是雲計算規則被大模型改變之後,百度智能雲自身面對新評價标準,給出的思考總結。
用侯震宇的話說,就是 " 從科幻向務實的轉變 ":
在被劃時代技術所震驚的最初,大家都期待着大模型有 " 解決一切 " 的表現。但當技術的優勢和局限在實踐中不斷被驗證,"效果" 和 "成本" 這兩個評價大模型的關鍵詞,也逐漸清晰起來。
這一方面,使得上雲使用大模型,成為絕大多數企業的首選:人人都想用大模型,還有不少人想打造自己的大模型,但同時,從頭打造大模型依然是一件高投入、高技術含量的事情。
另一方面,面對市場上越來越多的競争者,企業如何選擇、評估大模型及背後的雲計算服務,已成為新的需要被探讨的問題。
而從文心千帆的應對之道中,可以看出來自產業的三重新評估标準已經初現雛形——
大模型本身的能力
煉大模型的基礎設施能力
全棧技術的積累程度
新在何處?
大模型本身的能力不必過多解釋,一組數據足以說明:侯震宇透露,在文心一言開始企業内測以後,在與百度智能雲接洽大模型業務的客戶中,新客戶的比例已經超過了老客戶的比例," 有大量的機構,原先不太願意用,現在願意跟我們聊,也願意去用 " ——大模型本身,已經成為最主要的吸引力來源。
據介紹,截止目前,已有超過 300 家生态夥伴參與文心一言内測,在 400 多個企業内部場景取得測試成效。
值得關注的還有兩方面的變化:
其一,是評估大模型是否 " 高效好用 ",顯然算力已經不再是其中的唯一标準。
受限于自身大計算、大參數、高成本等特性,大模型此前在落地上一直存在瓶頸。
這也決定了企業在選擇大模型時,即使輸出效果足夠好,也必然還會考慮易用性、安全性、高效性、開放性、擴展性和全面性等諸多方面的因素。
如果拆解企業打造大模型的方式,會發現硬體算力只影響這些因素中的一小部分。
協同算力、框架、模型、應用這四層架構打造 AI 大模型,才能從根本上決定其端到端的輸出效果,是 " 最佳調優 " 模式。
打個比方,對于大模型而言,想要極致優化推理速度和使用成本,算力、框架、模型、應用就像是四個齒輪,各自轉速之外,很大程度上還要看它們之間的 " 配合能力 "。
此前,國内外雲廠商或多或少都已經在軟硬體技術協同方面進行布局,國外如亞馬遜、國内阿裡都已經在芯片層、模型層上發展了自研技術,微軟則也已經在框架層和應用技術上有所準備。
而目前在四層架構上均有自研技術布局的,就是百度一家。
這一布局成果,如今已經在成本降低上有直觀的體現:
此前 3 月份啟動内測時,如今不到 2 個月,百度大模型文心一言已完成 4 次技術版本更新,其推理成本更是已經降為原來的十分之一。
其二,是評估 " 生產 " 大模型的能力時,本質上考驗的是企業煉大模型的基礎設施能力。
算法、算力和數據,對于大模型而言缺一不可。值得一提的是,由于大模型的訓練和推理都需要大量算力支撐,因此雲廠商能把多少算力劃分入AI 算力的範疇,比單純的硬體數量更值得關注。
更重要的是,三者的綜合運用,大模型高效、穩定的訓練和有效的收斂,離不開扎實的工程基座。
其中涉及的工程問題實際上非常復雜,包括千卡通信、集群調度、大規模分布式檔案系統等等。
比如,文心千帆大模型平台,其實就是把模型開發、訓練、調優、運營等復雜過程封裝成能更高效調用的工具,來輸出百度打造大模型的工程經驗。
" 大家可能會覺得堆積算力、寫好代碼、然後進行模型訓練,把它跑起來就行了。實際上在訓練過程中會遇到各種各樣的挑戰,很少有人能夠使得一個大模型訓練過程能夠在連續一兩天内不出問題。" 百度智能雲雲計算產品解決方案和運營部總經理宋飛介紹。
而百度 AI 大底座,更是通過芯片、框架、模型、應用四層架構之間的高效協同,在基礎設施層面上,實現千卡加速比 90%、資源利用率 70%,開發效率提升 100%。這是 AI 大底座為大模型的開發和應用帶來的價值。
每一個時代的技術,有每一個時代評價标準。
而新标準的越辯越明,也往往意味着舊有格局的打破,和換道競争機會的到來。
智能手機之于非智能手機如此,電動車之于燃油車亦如此。
而現在,催生了大模型,又被大模型打破規則的雲計算,站在技術浪潮的最前沿,或許也同樣走到了變化的前夕。
正如李彥宏所說,大模型應用時代是一個全新的時代。
對于雲計算來說,第一批參考案例已經到來,更多新時代的新變化,還會遠嗎?
— 完 —
點這裡關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>