今天小編分享的科學經驗:金融場景的“四邊形戰士”,容聯雲赤兔大模型向行業飛馳,歡迎閱讀。
大模型狂飙突進之後,各行各業關注的焦點,逐漸轉移到了大模型的實用性與商業化,關注大模型在具體場景中能解決什麼問題。
其中,金融場景是許多大模型廠商和創業者都很關注的領網域,由于市場規模大、客戶付費能力強、對 AI 技術采納早、領網域專業性強易于構建數據壁壘……這些先天優勢,讓金融領網域的垂類大模型,展現出極強的落地和商用潛力,同時也掀起了激烈的市場競争。
不僅基礎大模型廠商積極向金融領網域進發,和金融夥伴聯合推出行業大模型,一些垂類企業也在積極研發,Bloomberg 率先推出了自研的 BloombergGPT ……這些面向金融場景的大模型,究竟有何差異呢?
最近,權威大模型評測榜單 C-Eval 剛剛更新,其中清華 & 智譜 Al、OpenAl、商湯科技、容聯雲等位居前列。
高達 50~100 億參數的容聯雲赤兔大模型,專注于金融垂類大模型,其成績表現超過了幾乎所有同等規模的模型,以輕量級模型跻身 GPT4 等千億模型為主的 TOP 梯隊。
百模大戰之後,通用大模型成為少數玩家的遊戲,更小參數、更易部署、更懂行業、更低落地成本的垂類大模型成為諸多行業和企業用戶關注的焦點。
我們不妨以表現突出的容聯雲赤兔為例,來聊一聊大模型在垂直行業的落地,究竟該點亮哪些技能點。
赤兔飛馳
在大模型賽場一戰成名
赤兔,被認為是馬中之王,是戰場上日行萬裡的悍将。從這個角度看,容聯雲赤兔确實 " 模如其名 ",在百模大戰中展現出和赤兔馬一樣的風采:
首先是快。今年 7 月,容聯雲在上海世界人工智能大會上發布了赤兔大模型,成為行業首個專注金融垂類大模型,到今天跻身權威榜單第六,崛起速度是非常迅疾的。
其次是猛。C-Eval 是由清華大學、上海交通大學和愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集,包含 13948 道多項選擇題,涵蓋 52 個不同學科和四個難度級别,是目前較為權威的中文 AI 大模型評測榜單。赤兔大模型能跻身 TOP 梯隊,獲得第六的成績,屬實是垂類大模型的一員猛将了。
垂類大模型更重要的是精。因為大模型落地的一個普遍痛點,是場景和效果不确定,将大模型和金融行業需求精準對接,需要在數據工程、知識工程、提示工程、應用探索等多方面,下 " 巧功夫 "。目前,赤兔大模型已經探索出了一些垂直場景,比如其賦能的溝通智能 2.0,專注解決客服和營銷場景下的知識庫、人工座席輔助及陪練、問答機器人、金牌銷售等需求,精準釋放大模型的技術價值。
總體來說,容聯雲赤兔不僅在大模型評測賽場上一馬當先,更重要的是,其在實用性和商業化探索上也邁出了重要一步,展現出國產大模型的落地速度和商用潛力。
金融 + 大模型
需要一個 " 四邊形戰士 "
當許多大模型廠商和創業公司,在為如何回收高昂的模型訓練成本發愁的時候,容聯雲赤兔所走的垂類大模型之路,展現出了較為清晰的商用前景和價值轉化能力。
不由地使我們好奇,容聯雲赤兔究竟做對了什麼?一言以蔽之,大模型在垂直行業的落地需要的是在知識、數據、可信、成本等層面沒有短板的 " 四邊形戰士 ", 容聯雲正是将這些工作做到前面、做到實處、做出差異化競争力,才能一馬當先。
1. 知識層面。機器學習的模式是提出抽象化特征并反向輸送給機器,從而實現智能,大模型也不例外。但到底提取什麼特征,如何給出評估決策,這些環節都存在大量領網域知識和行業 Know-How。不搞清楚這些問題,缺少知識驅動,大模型只能 " 大力出奇迹 ",一味追求龐大規模參數,帶來產業落地難以承受的高成本、部署難度、幻覺和不确定性。
為解決這一問題," 赤兔大模型 " 結合金融領網域知識進行訓練,可以真正理解客戶的開放問題,根據不同的業務需求和場景特點匹配相應回答,提高金融服務的效果。
2. 數據層面。AI 離不開數據,大模型尤其依賴超大規模的數據積累和标注。同時,要讀懂垂直行業如金融場景,只有通用數據還不夠,必須學習豐富的金融語料來深度理解金融内容,以保證大模型生成内容的質量和準确性。而領網域數據,往往涉及到行業機密和隐私數據,是很難獲得的、高壁壘的。這一點上,赤兔大模型展現出了特别的優勢。據了解,容聯雲首先通過開源和公開數據讓赤兔大模型獲得基礎能力,然後依托容聯雲長期積累的金融、營銷等領網域數據構建領網域模型,以解決特定行業的問題。在實際服務過程中,進一步基于業務數據和行業知識進行模型迭代,不斷提升赤兔大模型對金融的理解能力。
3. 可信層面。金融業 " 穩健經營 " 的要求,是一個嚴謹嚴肅的復雜場景,對大模型的可信、可靠、可解釋等要求非常高。如果大模型在生成過程中出現幻覺、答非所問、無中生有,這對于需要精準決策的金融用戶是無法接受的。解決這一問題,一方面需要專門的算法、數據工程等進行質量控制,同時要選擇恰當的場景并進行定制,以達到金融客戶采購所要求的質量。比如,赤兔大模型聚焦在一些容錯率較高的場景,如客服、營銷等,金融機構借助赤兔大模型,可以生成一套金牌話術,在電話咨詢等環節提高在線留存率,避免客戶流失,進而提高交易成交率。在一些交易類的敏感業務、用戶體驗要求極高的投訴類業務," 赤兔 " 的進入也更加謹慎,用更長的周期來探索。
4. 成本層面。一個共識是,行業和企業引入大模型是為了用的,為了降本增效發揮價值的,不是為了跟别人比拼先進性的。用大模型就要考慮到投入產出比。不僅企業用戶要考量大模型的使用成本,對于大模型的開發廠商來說,面對不低的訓練推理和長期維護成本,也需要在研發投入和商業回報周期之間進行平衡。
容聯雲 CEO 孫昌勳曾提到,在實際落地場景中,金融客戶更多使用十億級參數規模的模型來完成衣務。所以,赤兔大模型在參數規模和模型性能之間做到了極高的效率,以 50~100 億的參數達到了極高的生成能力,為客戶提供更高的性價比和滿足私有化部署的要求。以智能客服領網域為例,基于赤兔大模型,容聯雲生成式一體化智能客服平台,能将知識生產效率提升 70%,對話構建成本下降 80%,将服務效率翻倍。
不難看出,大模型要落地金融行業并不簡單,至少要具備 " 四邊形戰士 " 的條件,才能在產業化道路上快速前進,這也是容聯雲赤兔 " 一馬當先 " 的特别之處。
一馬當先
垂類大模型向何處去?
我們都不希望大模型的火爆只是昙花一現,而是深度融入產業智能化,實現長期繁榮。垂類大模型如何走的更遠?容聯雲赤兔大模型的戰略選擇,在今天也非常值得我們思考。
具體來看,容聯雲赤兔在幾次選擇中都選對了:
大模型的目标,選擇了 " 致用 "。
作為行業大模型的初入局者,容聯雲将大模型應用的立足點放在自身優勢行業——從 2013 年開始積累的金融行業,面向服務的上萬個客戶,提供匹配當前大模型能力和需求的產品,在客服、營銷等場景中先完成落地。
孫昌勳曾說過,行業大模型不是無限制地攀登技術高峰,而是在滿足客戶需求的前提下,盡可能節省成本。聚焦場景,解決具體問題,赤兔大模型的致用,才有後續的無限可能性。
大模型的優勢,選擇了 " 高能 "。
從年初快進到 " 百模大戰 ",我們看到太多企業和創業公司為了追逐 " 風口 " 而入局大模型,卻沒有考慮到後續的模型、商業等問題,要麼倉促離場,要麼模型推出後很快無人問津。
大模型落地業務場景的過程,不是一蹴而就的,後續還需要業務對接、數據互通、應用探索、平台建設、運維服務等一系列工作。容聯雲就非常注重大模型的長期能力:
具備雲通訊領網域老兵的優勢,形成了 " 通訊 + 數據 + 智能 " 的綜合技術能力,為赤兔深入金融場景,提供技術上的 " 硬實力 "。此外,大模型會涉及到敏感隐私數據,因此來自行業客戶,尤其是金融行業的信任,是大模型廠商至為關鍵的 " 軟實力 "。據了解,容聯雲已經和數家标杆性客戶進行聯合共創,每家客戶都專門派了團隊,和客戶一起做大模型之下的行業應用、產品迭代和更新,這又會進一步增強雙方的聯接和信任,為 " 赤兔 " 的產業化鋪下道路。
大模型的商業化路徑,則一開始就選擇了聚焦 " 行業 "。
大家應該都聽過 " 田忌賽馬 " 的故事,在白熱化的市場競争中,恰當的策略才能獲得商業化成功,形成良性循環。大模型的持續發展,離不開行之有效的產業化策略。正如容聯雲創始人兼 CEO 孫昌勳所說,AI 大模型更應該聚焦到行業,聚焦到客戶需求。相比涉及各領網域的通用大模型,企業其實更需要專精于某一領網域的行業大模型。因此,在選擇赤兔大模型的應用場景時,容聯雲優先考慮的還是匹配客戶需求以及商業化空間,加速了赤兔大模型的落地和價值兌現。
有一句俗語,說 " 努力 " 是速度," 選擇 " 是方向,方向錯了,越努力反而越快走向失敗。
對于成本高昂、競争激烈的大模型,面對群雄逐鹿的局面,更需要謹慎出手、做對 " 選擇 "。
像容聯雲赤兔這樣,在垂類場景裡深耕,不斷錘煉 " 四邊形戰士 " 的能力。
這條腳踏實地的路,才是大模型行穩致遠、做深向實的正确方向。
>