今天小編分享的互聯網經驗:李彥宏宣稱:百度文心一言中國領先,百度自動駕駛全球領先,歡迎閱讀。
4月16日上午,百度集團在深圳舉行 AI 開發者大會。
會上,百度創始人、董事長、CEO李彥宏發表演講表示,文心一言大模型用戶數突破2億,API日均調用量2億,服務客戶8.5萬,千帆平台AI原生應用19萬。
他在會上表示,過去一年,文心大模型經歷了從3.0~3.5再到4.0的版本的進化。而文心4.0在理解、生成、邏輯和記憶這4大能力方面都達到了業界領軍的水平。
李彥宏指出,文心一言模型已經成為中國最領先、應用最廣泛的AI基礎模型。
他提到,相比一年前,文心4.0大模型的算法訓練效率提升到了原來的5.1倍,周訓練有效時間能夠達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%,也就是說客戶過去一天調用1萬次,那麼今天同樣的成本之下,一天可以調用100萬次。
"媒體可能不會因為成本下降99%而感到興奮,但是企業也好,開發者也好,我們都知道一旦用起來最關注的就是成本和效果。我們在提升性能的同時,把成本降到了原來的推理成本降到原來的1%,就是因為百度在芯片框架模型和應用這4層架構上有着全棧的布局,通過端到端的優化,不斷的把成本打下來,讓更多的人可以高效低價的使用大模型來做AI應用。毫無疑問,大模型相關的話題在2024年還會是一個非常熱門的話題,各類的技術突破還會不斷的湧現,媒體也會繼續用震撼發布史詩級更新這樣的标題來進行渲染。"李彥宏稱。
李彥宏強調,大語言模型本身并不直接創造價值,基于大模型開發出來的AI應用,才是能夠真正滿足市場需求的東西。
然而他卻表示,"大模型和生成式AI将徹底改變開發者生态,自然語言将成為新的通用編程語言。我們分享的一些基于大模型開發AI原生應用的具體的思路和工具,這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。"
早前李彥宏在内部講話中表示,大模型開源意義不大,只有閉源是有真正的商業模式的,是能夠賺到錢的。而中國只有文心一言才做到最強。
李彥宏強調,未來,大型 AI 原生應用基本上都是 MoE架構;特點場景精調後的小模型使用效果可以媲美大模型;智能體能力的提升,會不斷催生出大量新的應用。而在這其中,更多開發者需要使用百度提供的相關模型工具。
李彥宏透露,截止到目前,已經有3萬個智能體被創建,5萬多名開發者和上萬家的企業入駐到了文心智能體平台。"我們的目标是讓每個人、每個組織都成為智能體的開發者,百度文心打造國内最完整的智能體生态。"
"未來,大模型會變成多模态的。換句話說,就是文字、圖片、語音、視頻等多模态的這種融合,成為基礎模型發展的重要方向,甚至我們認為是通往AGI的必經之路。"李彥宏指出,視覺大模型最大的應用場景其實是在自動駕駛,百度在這個方向上是做得最好的,是自動駕駛技術的全球領導者。
在李彥宏看來,文心一言大模型在中國 AI 領網域"全面領先",且應用最廣泛;自動駕駛技術方面,百度Apollo做到的是"全球領導者"。
"此時此刻我站在這裡,其實也是一個開發者創業者。我跟大家一樣的興奮,今天的中國有10億的互聯網用戶,有強大的基礎大模型,有足夠多的AI的應用場景,有全球最完備的產業體系,我們的國家也在大力的鼓勵和支持人工智能+行動。每一個人每一家企業,只要充分利用這些個工具,就可以釋放出來無限的創造力和生產力。今天人人都可以成為開發者,而未來也必将是一個由開發者們一起創造出來的未來。"李彥宏在結尾表示。
(本文首發钛媒體App,作者|林志佳)
以下是李彥宏《人人都是開發者》主題演講實錄:
你只要會說話,就可以成為一名開發者
大家好,歡迎參加Create 2024百度AI開發者大會,這是Create大會首次在粵港澳大灣區舉辦。今天現場來了5000多位開發者和科技愛好者。過去這一年,我跟很多創業者、開發者交流,感覺大家都處在一種"FOMO"狀态,也就是Fear of Missing Out,既興奮、又害怕錯過。确實,大模型和生成式AI,将徹底改變開發者這個群體。
過去,開發者用代碼改變世界;未來,自然語言将成為新的通用編程語言,你只要會說話,就可以成為一名開發者,用自己的創造力改變世界。
這一天并不遙遠,我們看到,因為有了強大的基礎大模型,有了很多低門檻,甚至零門檻的開發工具,開發者的生產力大大提高了。
比如,基于文心大模型的智能代碼助手Comate,不僅支持100多種語言和所有主流IDE平台,可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優化方案,還可以深度解讀代碼庫、關聯私網域知識生成新的代碼。上崗一年多,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業,生成的代碼采納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。
今天,你不會寫代碼,也可以做出一個AI應用;不用編程,也可以做出一個智能體。AI正在掀起一場創造力革命,未來開發應用就像拍個短視頻一樣簡單,人人都是開發者,人人都是創造者。
作為一家技術公司,百度的角色定位,就是盡可能地為大家提供所需的開發工具,不斷提升整個社會的創造力。具體來說,我們提供1個強大的基礎模型系列,就是文心大模型系列,這包括旗艦版的ERNIE3.5, ERNIE4.0, 也包括輕量版的ERNIE Speed、Lite、Tiny等等。
我們還提供基于大模型來開發各種應用的工具,包括智能體開發工具AgentBuilder,AI原生應用開發工具AppBuilder,以及各種尺寸的模型定制工具ModelBuilder。這三個工具,都代表了先進生產力。下面,我會給大家一一展示。
文心一言用戶超2億,文心大模型4.0工具版發布
首先講一下,文心一言和文心大模型的最新進展:
文心一言從去年3月16日發布,到今天是一年零一個月的時間。我們的用戶數突破了2億,API日均調用量也突破了2億,服務的客戶數達到了8.5萬,利用千帆平台開發的AI原生應用數超過了19萬。
我們看看,大家都在用文心一言做什麼?
視頻中的真人真事只是冰山一角。我們可以看到,文心一言正在改變更多人的工作和生活。
支撐文心一言的基座模型,就是文心大模型。過去一年,它經歷了從3.0版本到3.5,再到4.0版本的進化。文心4.0在理解、生成、邏輯、記憶四大能力方面,均達到了業界領軍水平。
近幾個月來,文心大模型在代碼生成、代碼解釋、代碼優化等通用能力方面實現了進一步的顯著提升,達到國際領先水平。
今天,我們正式發布文心大模型4.0的工具版,現在,大家可以在工具版上,體驗代碼解釋器功能,通過自然語言互動,就能實現對復雜數據和檔案的處理與分析,還可以生成圖表或檔案,能夠快速洞察數據中的特點、分析變化趨勢、為後續的決策提供高效精準的支撐。
文心大模型已經成為了中國最領先、應用最廣泛的AI基礎模型。
不僅如此,相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。
也就是說,客戶原來一天調用1萬次,同樣成本現在可以調用100萬次。媒體可能不會因為成本下降99%而興奮。但是企業也好,開發者也好,一旦用起來,最關注的就是效果和成本。
我們能在提升性能的同時,把推理成本降到1%,正是因為百度在芯片、框架、模型、應用這四層架構上有着全棧的布局,通過端到端優化,不斷地把成本打下來,讓更多人都可以高效、低價地用大模型來做AI應用。
毫無疑問,大模型相關的話題,在2024年依然會很熱,各類技術突破還會不斷湧現。媒體也會繼續熱衷于用"震撼發布""史詩級更新"這樣的标題進行渲染。但我想強調的是,大模型本身并不直接創造價值,基于大模型開發出來的AI應用才能滿足真實的市場需求。
分享開發AI原生應用的具體思路和工具:"踩了無數的坑,交了高昂學費"
今天我想跟大家分享的是一些基于大模型開發AI原生應用的具體思路和工具。這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。
第一是MoE。未來大型的AI原生應用基本都是MoE架構,這裡所說的MoE不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。但什麼時候調用小模型、什麼時候調用大模型、什麼時候不調用模型,這都是有技術含量的,要針對應用的不同場景做匹配。
第二是小模型。小模型推理成本低,響應速度快,在一些特定場景中,經過SFT精調後的小模型,它的使用效果可以媲美大模型。這就是我們發布Speed,Lite、Tiny三個輕量模型的原因。我們通過大模型,壓縮蒸餾出來一個基礎模型,然後再用數據去訓練,這比從頭開始訓小模型,效果要好很多,比基于開源模型訓出來的模型效果更好,速度更快,成本更低。
第三是智能體。智能體是當下很熱的一個話題,随着智能體能力的提升,會不斷催生出大量新的應用。智能體機制,包括理解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成復雜任務,在環境中持續學習、實現自我迭代和進化。在一些復雜系統中,我們還可以讓不同的智能體互動,相互協作,更高質量地完成任務。這些智能體能力,反思、規劃、自我計劃的能力,我們已經開發出來了,并且向開發者全面開放。
在MoE、小模型、智能體這三個方向上,百度都已經給大家做好了"開箱即用"的工具。下面,我就給大家介紹三種不同的工具,分别是:智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。
智能體開發工具AgentBuilder:
智能體是裡每個人最近、最主流的大模型使用方式
首先是智能體開發工具AgentBuilder。智能體可能是未來離每個人最近、最主流的大模型使用方式,基于強大的基礎模型,智能體可以批量生成,應用在各種各樣的場景。
百度剛剛更新了文心智能體平台。截至目前,已經有3萬多個智能體被創建、5萬多名開發者和上萬家企業入駐。我們的目标是,讓每個人、每個組織都成為智能體的開發者,打造國内最完整的智能體生态。
那如何實現這個目标呢?就是給大家提供零門檻的智能體開發工具AgentBuilder。
下面我們就先以"新加坡旅遊局"為例一起看看,一個智能體是如何做出來的。
首先,我們打開文心智能體平台,創建頁面有着零代碼、低代碼兩種模式,新手可以直接選擇"零代碼模式",用自然語言,幾句話就能創建一個智能體。
我們先給智能體起名叫"新加坡旅遊局",然後在設定裡寫明需要打造旅遊方案、解答問題,提供酒店門票預訂服務,這些設定都是用來指導智能體的,告訴它都能做什麼。
如果只需要基礎智能體,平台會自動完成填寫。但我們希望"新加坡旅遊局"是一個專業的智能體,所以要進行高級配置。我可以把新加坡百科詞條和官網鏈接都添加到知識庫裡,讓它每天更新。然後添加一些工具,如酒店查詢、景點門票購買等,增強它的服務能力。目前我們已經跟攜程合作,提供了酒店、景點、票務等旅遊服務工具。這樣,一個新加坡旅遊局的智能體就做好了,可以進一步預覽、調優。
現在打開百度APP,搜索"什麼時候去新加坡人最少",因為大家出去旅遊都想避開人潮。智能體會綜合多個來源的信息,生成一個答案,"1-3月人最少"。我們還可以點擊智能體,和它進一步互動,比如去新加坡旅遊的注意事項,推薦新加坡排名前三的酒店,還能讓它直接預訂新加坡環球影城的門票,一站式解決需求,大大節省了用戶時間。
除了新加坡之外,大連、沈陽等文旅類智能體也都在文心智能體平台上線,還有知識類、創作類、學習類、娛樂類等各式各樣的智能體,這些都是用AgentBuilder做出來的。
去年文心一言剛發布的時候,我就說過,文心一言會影響到每一家公司。因為它強大的自然語言理解能力、表達能力、推理能力,可以使任何一個公司都離自己的客戶更近。
今天,每一個商家、每一個客戶,都能在百度擁有專屬的智能體。整個過程完全不需要編程,通過類似提示詞的信息輸入,和簡單的幾步操作調優,就能迅速生成一個智能體,成為7X24小時在線的金牌業務員。
我們來看一下,一個商家智能體是怎麼做出來的。
啟德教育是家知名教育企業,在全國有60多家分支機構,還有很多海外分公司,覆蓋國家廣,對接待的話術要求很高。如何能全天24小時回復客戶的咨詢,并且提高接待水平、降低經營成本呢?
啟德教育利用百度的AgentBuilder,打造了專屬的智能體。
我們來看看,如何打造一個具備基本能力的智能體。很簡單,在平台上填寫智能體的頭像、名稱、經營業務範圍和歡迎語,再設定一些需要用戶提供的信息,比如年齡、學歷。5分鍾、零門檻,一個智能體就做好了。
啟德教育還希望這個智能體是個懂業務、懂學生的留學顧問。它可以針對學生的不同情況,比如想去美國還是澳洲、是碩士還是學士、雅思和托福考了多少分等等,做出專業分析,給出精準回答。我們可以通過添加知識、角色、工具這幾大模塊,來打造一個更高級的智能體。
在知識模塊中,上傳私網域知識,讓平台實時解析,自動生成對話語料;在角色模塊,把一些不在經營範圍内的留學國家,增加到過濾方案中,可以提高用戶線索的有效率;在工具模塊,加入預約到店等服務。通過這樣幾步簡單操作,一個擁有專業能力的啟德教育智能體就做好了。
現在,我們來搜索"澳洲留學申請條件",可以看到智能體快速給出了需要的語言能力、專業選擇等七大必備條件,還給能出相應的留學咨詢方案,對各種難題都有問必答、有求必應。
啟德教育智能體非常的受歡迎,上線第一周,就成功分發了155萬次,與用戶互動了5.8萬次,線索轉化量直線增長、有效線索的轉化成本明顯降低,經營效率大幅提升。
下面,我再給大家介紹一個家居行業的智能體。
索菲亞是專注全屋定制的家居品牌。就像剛剛展示的,它也可以通過填寫極其簡單的信息,創建出一個基礎的商家智能體。但對于家居行業,消費者的線下體驗更重要,所以索菲亞希望能在線上打造出一個金牌銷售,還原線下的接待體驗。
因此在進一步的設定中,它在角色模塊,選擇了數字人作為展示方式,然後給數字人選取了合适的背景和聲音,并且結合平台的智能解析能力,自動總結了一套銷售話術。最終打造出一位溫柔親切、話術專業的金牌銷售,她能24小時滿足用戶的各種需求,提供高水準的服務體驗。
當百度搜索用戶有裝修訴求時,索菲亞智能體會利用文心大模型的能力,優先給出問題的答案。除此之外,她還會主動與客戶确認具體需求,如裝修類型、預算等,并推薦附近的線下門店。
索菲亞商家智能體上線以來,有效線索成本下降了30%。也就是說,它獲得一個有效客戶,如果過去的成本是100塊,現在只需要70塊了。
目前,已有超過1萬個百度的客戶擁有了商家智能體,涵蓋了教育培訓、房產家居、機械設備、商務服務等超過30個行業。
上面,通過三個Demo,我展示了開發者和商家,如何利用AgentBuilder,制作不同行業智能體的過程。
現在,制作一個智能體,真的就是分分鍾的事。但問題來了!如果沒流量、沒分發、找不到、沒人用,那麼開發者和商家就沒有收益,沒有收益就沒有動力。怎麼解決這個痛點呢?
我們的文心智能體平台,為開發者們提供了流量變現的通路。除了百度搜索,百度生态的其他產品,如小度、地圖、貼吧、車機等,都能接入智能體的相關能力,為開發者解決流量分發的後顧之憂,獲得實打實的收益。
有分發,就會有數據反饋;有數據反饋,飛輪轉起來,智能體就能夠自主迭代,越用越聰明。文心智能體平台還上線了智能體的數據分析和問答調優模塊,不久後還将有更多的新能力上線。文心智能體平台将通過分發-診斷-收益的數據飛輪,驅動智能體形成質量更優、流量更好、收益更大的正循環。
AppBuilder:自然語言三步就能開發一個應用
下面,我給大家介紹第二個開發工具,AppBuilder。它是目前最好用的AI原生應用開發工具。在AppBuilder上面,我們提前封裝和預置了開發AI原生應用所需的各種組件和框架,大幅降低開發門檻。
最快只需三步,開發者就可以用自然語言開發出一個AI原生應用,并且能夠便捷地發布、集成到各種各樣的業務環境中。我們來看幾個案例:
今年年初,我們搞過一期AI原生應用開發挑戰賽,賽題是利用AppBuilder打造一款"遊樂場排隊規劃助手",幫助遊客更好地了解遊樂場排隊情況,設計個性化的遊玩路線,在有限時間内獲得最好的遊玩體驗。
這期比賽的冠軍選手,沒寫一行代碼,就開發出了應用,拿到了百度提供的10萬元大獎。這個題目如果會寫代碼的話,你寫一個并不難,但是你一行代碼都不寫還能做出來,那還是非常依賴基礎模型和AppBuilder這個工具的能力的。
我們來看下,怎麼用AppBuilder,把這個AI應用做出來。
我們先回顧一下賽題。它假定了"環球影城"各個項目的排隊時間和刺激指數,那麼在有限的時間内獲得刺激指數最高的體驗,就是這期賽題要解決的問題。
首先,打開AppBuilder的開發界面,給應用起名"遊樂場排隊助手";第二步,我們在角色指令中描述具體要求,包括調用代碼解釋器、算出在固定時間内的最佳組合、輸出結果等;第三步就是到工具組件中,把代碼解釋器添加進來,幫助運算。
現在,我們來測下效果,在右側輸入問題"我有3個半小時時間,怎麼玩最刺激?",可以看到,代碼解釋器将這個問題翻譯成了代碼,再調用數據理解工具,對已知條件進行分析。經過一系列計算,得出将《哈利波特禁忌之旅》、《侏羅紀大冒險》、《霸天虎過山車》、《大黃蜂回旋機》,這四個項目組合遊玩,效果最佳。測試沒問題,點擊發布,在零代碼的情況下,一個應用就生成了。
現在,AppBuilder又進一步更新了,在創建的過程中,全部可以通過"AI優化配置"功能,自動幫助開發者優化角色指令、組件配置等環節,進一步提高開發效率。
我們再看一個例子。
今年年初,華北電力大學提出,希望為全校師生提供智能化的專屬服務。基于百度的AppBuilder,我們共同打造了一個華電AI助理,下面,我來給大家展示一下,華電AI助理是怎麼做出來的:
第一步:打開AppBuilder,進入創建頁面,點擊AI自動生成配置。首先為應用設定名稱、簡介、頭像等基本信息。
第二步:通過自然語言在角色指令中描述具體要求,包括任務、組件能力、要求與限制。
第三步:插入自定義的圖書借閱查詢、課表查詢、學生成績查詢等組件,讓校園助手能夠具備智能化服務的能力。之後再為校園助手添加一個開場白,這樣應用就配置好了。
接下來,我們在預覽界面中,結合用戶提問,對助手進行調試。比如詢問四六級考試的報名時間,測試各組件自動調用的效果。
大家可以看到,通過這些簡單的操作,這個應用就構建完成了。目前已經小規模測試上線,接入了查制度、查課程,充飯卡、借書籍等高頻場景,服務了學校廣大師生。後續,我們将與華北電力大學一起,進一步深化應用合作,提供更為豐富便捷的服務。
百度在跨模态方面,也有着多年技術積累。在AppBuilder上面,我們也提供了一定的跨模态能力,你只需要給一段文字,或者幾句話,就可以快速創建繪畫類的應用,像漫畫、兒童畫本等。
過程也很簡單:打開AppBuilder,點擊進入"應用創建",輸入角色指令,選擇"添加文生圖"組件,再輸入三個推薦問題,就可以點擊發布了。應用做好後,我們只需要輸入一個大概想要的角色或劇情,AppBuilder就可以自動生成故事、輸出圖畫。
百度文庫最新推出的智能漫畫和畫本生成功能,就利用了AppBuilder上提供的這類組件。我們來看看,百度文庫的漫畫生成功能,是如何讓每一個有創想的人,都能做出好作品的。
咱們以經典的《周處除三害》為例。
打開百度文庫,輸入主題《周處除三害》,這在《晉書》和《世說新語》裡都有寫到,文庫搜索後,會根據原文生成故事,我們也可以再對故事内容進行修改;然後點擊右側的AI工具欄,開始創建這篇漫畫。
進入漫畫制作界面,文庫将根據故事情節為我們自動生成漫畫分鏡;然後從光影、寫實、卡通等多種風格中,選擇最貼合故事的漫畫風格;最後根據角色選擇不同的人物形象,這樣就完成了漫畫的生成。
漫畫生成後,我們可以在百度文庫的智能漫畫編輯器裡,浏覽完整的漫畫。同時,文庫支持對每一個畫面進行編輯、修改和精調,比如,在左側選中畫面"周處與白額虎",點擊編輯,增加畫面描述"人物面容清晰,畫面明亮",就能精調出更符合需求的漫畫。大家看到,百度文庫的漫畫功能在角色和場景的風格一致性方面,都做得非常出色。
百度文庫的智能漫畫能力,極大地提高了創作漫畫的效率,降低了漫畫創作的成本和門檻,可以讓更多有想法、有創意的人實現自己的漫畫創作夢。
不止生成漫畫,百度文庫現在還可以幫助用戶零門檻的創作畫本。大家可能不知道,中國小孩一年的人均繪本閱讀量只有10本,而歐美國家是50本左右。現在,AI能夠讓完全沒有繪畫能力的父母,也可以為自己的孩子創作一個專屬的兒童畫本了。下面我們就來看一下這個圖文并茂的有聲畫本吧!
從去年開始,我們用AI重構了百度文庫,使它成為用戶"内容生產的起點"。如今,在AppBuilder的支持下,百度文庫新推出的智能漫畫和智能畫本功能,更是把場景延伸到了更加有趣的跨模态創作領網域。
剛才我用三個案例,展示了如何用百度的AppBuilder,做出AI原生應用。大家應該能夠感受到AppBuilder的兩個明顯優勢:
一是功能強大。依托文心4.0對指令的理解和遵循能力,我們的AppBuilder,能保證冷啟動就能達到一個不錯的水平,不會因為效果差,再花很長時間去調優,大大降低了開發門檻。依托檢索增強技術RAG,在知識問答等典型場景,我們的問答準确率和友好回復程度都達到了95%以上,大幅超越其他同類產品。AppBuilder還提供豐富完整的組件工具,包括百度搜索等基于百度多年技術積累的AI能力組件、大模型能力組件,還有百度獨家開放的業務組件等55個組件。以及一些主流場景的第三方API,比如班機查詢、論文查詢等。我們還剛剛支持了自定義組件,客戶可以直接對接自己專有的任何工具和數據。這些豐富的組件,共同支撐起了AI原生應用的高效開發。
二是簡單易用。使用AppBuilder,只需三步即可快速創建應用、一鍵分發。我們也支持開源的SDK,方便大家進行二次開發。
模型定制工具ModelBuilder:高效低價生產模型
下面我再介紹一下更适合專業開發者使用的工具,那就是ModelBuilder,它可以根據開發者的需求定制任意尺寸的模型,并根據細分場景對模型進一步精調SFT,這樣就能達到更好的效果。對開發者來說,用好大模型很重要的一件事兒,就是掌握模型精調的方法。
我們以教育行業的作文批改場景來舉例。因為作文批改有明确的評分标準,并且不同年級對作文的要求和打分标準,也是不同的。這就需要模型精調,讓大模型輸出的結果,更符合特定的要求。
我們就來看一下,ModelBuilder是如何實現作文批改的模型精調的。
第一步:創建數據集。模型精調的效果很大程度依賴我們的數據質量。在這個案例中,原始數據只有180條,質量也不夠高。我們就需要用到三個功能:數據清洗、數據标注和數據增強。數據清洗,可以快速去除數據的空缺、亂碼等問題。數據标注方面,我們對作文增加了更多維度,比如内容深度、寫作手法等評價。數據增強功能,可以生成同類但不重復的數據,進行數據擴充。擴充後,ModelBuilder給我們生成了920條高質量數據。
第二步,就進入模型精調階段了。首先,我們需要選擇一個進行精調的基礎模型,這裡我們選擇了ERNIE Speed作為基礎模型。然後,我們根據平台推薦值來配置參數,這次數據接近1000條,按照推薦的迭代輪次,配置為10輪,然後就可以讓模型開始訓練了。
第三步:把模型部署在平台上,這樣整個精調過程就完成了。
我們來用一篇中學作文,測試下精調後的模型效果。作文題目是《期待長大》,題材不限,不少于800字。
我們将一篇學生的作文及批改格式要求,輸入到精調前後的兩個模型裡。來看下,兩個模型及老師點評三者的對比。可以看到,精調後的大模型擁有了更加專業的老師點評思維、更好地做了格式遵循。原本老師需要較長時間才能完成的作文批改任務,現在借助大模型,幾秒鍾就可以快速完成,大大地提升了給學生反饋的速度和效率。目前,這一類精調後的模型,已經在多個教育行業的頭部企業中應用起來了。
我前面談到大型AI原生應用一般都是MoE。那麼,該如何組合使用這些模型,獲得最好的性價比呢?下面,我就用小度來展示一個MoE模型路由的案例。我們首先來看看,有了大模型的加持,小度是不是變得更聰明了:
Robin:小度小度
小度:在呢
Robin:今天有什麼新聞?
小度:小度播3-5條當日新聞快訊
Robin:小度小度。聽說你最近長本事了?
小度:我不單能陪你聊天,還能做你的AI日程助手
Robin:那我要來考考你了。幫我安排一下日程,今天活動結束後,我會和張總一起用晚餐,之後在酒店有個管理層的會議,大概需要1個半小時,希望10點之前可以結束。明早我準備晨跑,看看天氣如何,然後上午8點有個早會,請幫我安排好日程。
小度:根據您需求,小度給您制定最優的日程安排如下
o 您與張總晚餐安排在18:00-19:30,結束後,您将在20:00參加管理層會議,21:30左右結束
o 明早6點鬧鍾将提醒您起床去晨跑,跑步時長控制在1個小時以内,确保明早8點早會不遲到
o 明早天氣晴朗,氣溫25度,建議您穿短袖外出,做好防曬
o 您看我能不能當你的秘書,我還有更多新技能呢
Robin:挺好的,很棒(向小度豎起大拇指),把這些日程同步到我的手機上吧。
剛剛,我向小度提出了好幾個問題,其中既有簡單的新聞問詢,也有復雜的日程安排需求。看起來是跟同一個小度在交流,其實背後調用了不同的模型。當它接受到我的問題後,先是由小模型ERNIE Tiny執行了"模型路由"的工作;對于天氣問題,它根據天氣查詢的結果,調用基于ERNIE Lite打造的精調模型,也是經過SFT的ERNIE Lite,給出了穿衣建議;對于更復雜的日程安排,則調用了性能最好的大模型——文心4.0,來計算出從今晚到明早的各項事項安排。
今天,我們提給小度的每個問題,都會這樣分配給不同模型來執行,調用應用的API接口時,會用ERNIE Functions模型,給孩子講題時,用文心大模型3.5或4.0,智能助理的打造則用了ERNIE Character模型,提高人設一致性、激發用戶聊天欲望。
通過這種大小模型的組合調度方式,小度不僅順利完成了"換腦行動",裝上了全新的AI原生作業系統DuerOS X,而且形成了效果、速度和成本的最優組合,相比全部使用文心大模型的旗艦版,讓響應速度提升2倍,成本下降了99%。剛才和我對話的這個小度添添AI平板機器人,昨天已經在各大平台全面開售,有興趣的朋友們可以即刻下單體驗了。
這幾個關于ModelBuilder的例子,展示的是百度高效低價生產模型的能力。因為有了最強大的基礎模型文心4.0,我們可以根據需要,兼顧效果、響應速度、推理成本等各種考慮,裁剪出适合各種場景的更小尺寸模型,并且支持精調和post pretrain。這樣通過降維裁剪出來的模型,比直接拿開源調出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低。大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。
為了方便大家快速上手,ModelBuilder預置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0,這是旗艦版的大模型,它适合通用的復雜場景,能力強大;還有三個輕量級的大模型, ERNIE Speed、Lite、Tiny;另外還有兩個垂直場景的模型,ERNIE Character适合角色扮演;ERNIE Functions适合對話或問答場景中的外部工具使用和業務函數調用。當然ModelBuilder也支持國内外第三方主流模型,總數量達到77個,是國内擁有大模型數量最多的開發平台。
第二屆"文心杯"創業大賽正式啟動:設5000萬元特别大獎
對于開發者,我們除了提供這些開發工具,還提供資金和資源方面的支持。
去年5月份,百度啟動了"文心杯"創業大賽,希望推動大模型生态繁榮,打造更有活力的生态系統,幫助創業者、開發者開發各種AI原生應用。第一屆"文心杯"創業大賽,我們收到了近1000支創業團隊報名,百度為其中的15支優勝團隊,提供了近億元的投資支持,并且在技術、團隊和資源上持續提供全方位扶持。
今天我宣布,第二屆"文心杯"創業大賽正式啟動。這次我們将擴大項目篩選範圍、設定分賽場,面向全球市場及高校學子,招募創業創新團隊,只要你的創業方向是AI原生應用,都可以在大賽官網報名參賽。同時,我們也加大了對創業者的支持力度,提供更充足的投資資金、更豐富的業務資源,還首次設立了"特别大獎",特别優秀的項目将有機會獲得最高5000萬人民币的現金和資源支持。
中國的創業者和開發者,非常善于利用新技術來開發應用。我相信,文心大模型将成為中國AI創業者和開發者的首選,越來越多的應用會建立在文心大模型之上。我也期待,更多創業者和開發者加入我們,一起構建繁榮的AI生态。
視覺大模型最大的應用場景是自動駕駛
前面我們談到的這些工具和案例,大部分都是基于大語言模型的。面向未來,我認為多模态大模型,或者說文字、圖片、語音、視頻等多模态的融合,是基礎模型非常重要的長期發展方向,是通往AGI的必經之路。百度在這些領網域有着長期投入,并将及時更新技術進展。
我有一個非常不一樣的判斷:視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是最好的,是自動駕駛的全球領導者,我們不只訓練AI如何生成視頻,更訓練AI理解真實世界發生的事情并預測未來。
基于超過1億公裡的、中國復雜城市道路測試裡程數據,百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、适應性更強、更安全的自動駕駛方案。
百度地圖也率先将視覺感知大模型應用到了制圖領網域。現在,全球最大規模的車道級地圖數據,已經上線全國360座城市。只要百度地圖導航能去的地方,智駕就都能開。
今年春節後,百度的蘿卜快跑實現了萬裡長江"第一跨", 我們把服務從長江的北岸延伸到了南岸,在武漢的部分區網域,我們已經實現了7X24小時的全天候運營,還計劃年内在武漢部署1000台無人駕駛車輛。
這是自動駕駛走向真正商業化的一個标志性事件,它不再僅僅是區網域性的示範,而是進入到了城市級應用示範的新階段。蘿卜快跑在武漢覆蓋了3000多平方公裡、770萬人口,是全球範圍内最大規模的自動駕駛運營區網域。
"打包帶走,随取随用"
剛才,我給大家展示了百度文心大模型系列,以及三個開發工具——AgentBuilder、AppBuilder、ModelBuilder,他們組成了一個工具箱,你們可以馬上打包帶走,随取随用。
此時此刻,我站在這裡,其實也是一個開發者、一個創業者,跟大家一樣興奮。今天的中國,有10億互聯網用戶,有強大的基礎大模型,有足夠多的AI應用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持"人工智能+"行動,每一個人,每一家企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。
今天,人人都可以成為開發者。而未來,也必将是一個由開發者一起創造出來的未來!
謝謝大家!