今天小編分享的互聯網經驗:我們需要怎樣的大模型?,歡迎閱讀。
AI 時代,我們需要怎樣的大模型?
這個問題盡管我們無法給出一個确定的答案,但顯而易見的是,用戶的選擇正逐漸匯聚成一股趨勢。
6 月 28 日,在 WAVE SUMMIT 深度學習開發者大會上,百度公布了文心一言階段性成果:用戶規模達 3 億,日調用次數 5 億;同時,在過去短短半年時間裡,文心大模型用戶日均提問量增長了 78%、提問平均長度提升了 89%。這說明用戶對文心一言的使用越來越高頻,也越來越深入,問的問題也越來越復雜、多樣。
真實的使用場景也印證了當下文心一言的通用性。大會現場我們看到了極具代表性的案例:創作 5.9 億篇文章、編撰百萬篇專業研報、解答了 1.7 億學習問題;在剛剛過去的高考中,高考學生使用文心一言設計全學科考卷備考方案,家長利用它輔導孩子學習和升學規劃。
或許,用戶用手投票選出的模型,才是真正符合時代需求的模型。
文心大模型 4.0 Turbo,速度快、效果好
在現場,百度首席技術官,深度學習技術及應用國家工程研究中心主任王海峰博士談到了他對通用人工智能的見解:" 說起‘通用人工智能’這個詞,在我看來有兩點非常重要:一是技術的通用性;二是能力的全面性。"
2019 年上半年,在第一屆 WAVE SUMMIT 上,百度正式發布了文心大模型 1.0,到 2023 年 3 月 16 日發布了基于文心大模型 3.0 的文心一言,2023 年 5 月更新了 3.5 版本,10 月發布了 4.0。2024 年百度發布了文心大模型 4.0 工具版,背後加入了更好的智能體技術。
在大會中,文心大模型 4.0 Turbo 版本的更新,速度更快,效果也更優。這不僅是技術的一次飛躍,更是對用戶需求深刻理解的體現,誰不想要響應更快、回答更好的大模型產品?
現場演示直觀地展示了文心大模型 4.0 Turbo 與 4.0 的差異:在生成速度上 Turbo 版本明顯更快,而内容生成的優化也更為顯著。可以說,它不僅在算法上實現了通用性,更在理解、生成、邏輯和記憶等基礎能力上展現了全面性,使得 AI 能夠更好地模拟和擴展人的智能。
随着技術的發展,用戶對 AI 的期待已經從簡單的工具使用,轉變為尋求能夠理解、預測甚至參與決策的智能夥伴。而大模型的普世化是一個将高級人工智能技術普及到日常生活各個角落的過程。
要實現這一點,關鍵在于降低甚至消除技術使用門檻,讓技術的存在變得自然而不顯眼,即讓用戶在使用過程中幾乎感覺不到技術的存在,也就是所謂的 " 無感感知 "。
以 " 農民院士智能體 " 為例,這一智能體的推出,讓農民也能享受到 AI 帶來的便利。無論是在田間地頭,還是在家中,農民都可以通過文心一言的 APP、百度 APP、網頁端,甚至是小度設備,随時随地獲取農業生產的智能支持。這種普及化的應用,不僅極大地拓寬了 AI 技術的閱聽人群體,也使得技術更加接地氣,更易于被接受和使用。
生态的多端布局,為文心大模型 4.0 Turbo 版本的普世化提供了強有力的支持。硬體端的多樣性和軟體端的多端生态,共同構建了一個全方位、多層次的智能服務體系。這種生态的構建,使得 AI 技術不再局限于單一的應用場景,而是能夠滲透到人們生活的每一個角落。
文心大模型 4.0 Turbo 版的多端開放策略,進一步加速了這一進程。網頁端、移動端的陸續開放,以及 API 面向開發者的開放,使得它能快速地與各種應用場景進行融合,實現更廣泛的連接和更深入的互動。這種開放不僅為開發者提供了廣闊的創新空間,也為用戶帶來了更加豐富和便捷的智能體驗。
做好的大模型,需練内功
内功和外功的區别在于,内功主要是内力,外功主要是拳腳功夫,任何武功若想發揮最大的威力都離不開内功的精深。大模型的發展也是一樣的。
文心大模型是百度苦練内功的產物,背後離不開飛槳,一個百度自主研發的深度學習平台。它不僅承載着模型的開發與訓練,更在芯片與模型之間架起了橋梁,實現了技術的承上啟下。簡單地說,飛槳平台為大模型提供了一個全面、高效、可擴展的開發環境。它通過降低技術門檻,使得更多的研究者和開發者能夠參與到 AI 模型的創新與實踐中。
就在這場大會上,百度也發布了飛槳框架 3.0,這一版本通過訓推一體化,實現了訓練和推理過程的無縫銜接,提升了模型從開發到部署的效率。同時,自動化的優化,如自動并行技術,簡化了分布式訓練的復雜性,使得開發者能夠更加專注于模型本身的創新,而非底層的計算細節。
在整個大模型行業注重成本效益和效率的今天,訓推一體化更具有現實意義。同時面對整個異構多芯的算力部署環境,飛槳框架 3.0 也針對性地進行了優化設計,讓更多開發者和企業用戶能夠通過飛槳進行大模型開發。而動靜統一的自動并行技術,允許開發者使用動态圖進行模型設計,同時自動轉換成靜态圖以優化性能,這種靈活性和性能的平衡,是飛槳框架 3.0 基于開發者需求做的技術更新。
在當前大模型行業的競争格局中,深度學習框架的重要性不言而喻。它不僅是模型訓練和部署的平台,更是一個完整的生态系統,包括豐富的 API、工具庫和社區支持。這表明,做好的大模型,需要的不僅是模型算法的創新,更關鍵的是背後的工具鏈和生态系統的完善。
飛槳可以說是文心大模型修煉的 " 内功 " 之一。
而于整個行業而言,強大的開發框架成為支撐應用創新的基石。
據介紹,目前飛槳平台已經凝聚了超過 1465 萬開發者,服務了超過 37 萬家企事業部門,與開發者共創超過 95 萬個模型。
大模型,落地為王
很多公司講大模型,但卻并不會真正用大模型。而百度不同,它不僅自己做大模型,還要實實在在地把大模型用起來。可以踩坑、可以交學費,但不能不用。
在百度有一名特殊的 " 程式員 ",Comate 智能編程助手,這是一個集成在 IDE 中的智能編程插件,支持超過 100 種編程語言,覆蓋了幾乎所有主流的集成開發環境。它能夠根據開發者的編碼習慣和項目上下文,智能預測并生成代碼,提升編碼效率,幫助開發者進行代碼自動生成,解決程式員工作過程中常常要面臨的重復的工程性問題。
會上,Comate 正式更名 " 百度快碼 ",這個本土的中文名字可能更加适合它。
" 快 ",是核心關鍵詞。一是開發速度快,使用文心快碼以後,工程師部門開發時間内,代碼提交數量提升了 35%,這個數字背後意味着原本工程師需要 7 天才能完成的工程量,在 5 天就能夠開發完成。這使得工程師們可以釋放更多的生產力,發揮更多的創造力。
二是業務迭代快。目前百度内部有一半的研發需求百度快碼可以在一周之内完成交付,這意味着百度的產品能夠更快的響應市場和客戶的需求。在剛剛發布的飛槳 3.0 版,通過知識增強後,它的代碼生成準确率能夠高達 80% 以上,減少修改和調試,保證快速迭代。
三是企業落地快。不只百度自身,其客戶喜馬拉雅在一個季度内就落地部署了文心快碼,并且實現了代碼采樣率達到 44%,先進的技術能力也共享給更多行業。
這充分說明,好的大模型和應用一個共生的結果。
甲骨文,作為中國最古老的文字之一,記錄了商朝的歷史和文化。然而,甲骨文的解讀和研究一直是一項艱巨的任務,因為許多甲骨碎片上的字迹難以辨認,且現存的甲骨文資料分散在世界各地。
這是一項在安陽傳承了三代的歷史性任務,在這一代,傳承的歷史重任,也落在了 AI 技術上。
利用文心一言的能力,百度與安陽師範學院甲骨文信息處理教育部重點實驗室展開重點合作,進行了一系列創新性的甲骨文研究工作。人工智能技術可以實現甲骨采集、碎片綴合、字元識别、智能檢索,大大提高甲骨文的研究效率。
甚至他們還通過文心大模型進行了創新,發布 " 來自甲骨文的回答 " 互動問答程式,用戶可以調用文心一言的對話能力以及對甲骨文釋義的能力,讓古老的甲骨文重新 " 活起來 "。
在甲骨文項目中,傳統文化和創新科技有了連接。在與 IFAW 野生動物保護協會合作中,AI 又讓技術與生命產生羁絆。
國際愛護動物基金會(IFAW)致力于野生動物的保護工作。面對非法野生動物貿易的嚴峻形勢,IFAW 與百度合作,利用 AI 技術打擊網絡渠道上的非法交易。
打擊非法野生動物交易面臨着一個難題:網絡上海量的只有圖片配合 emoji 等模糊文字的售賣,使得識圖成為一項關鍵環節。
IFAW 與百度飛槳團隊合作開發了 " 瀕危物種 AI 守護官 ",通過文心大模型的識圖能力識别野生動物制品圖片,在 2019 年實現了 1.0 版本的開發。在這個過程中,IFAW 提供了大量的野生動物制品圖片作為訓練數據,幫助 AI 模型學習識别非法制品。通過飛槳平台,AI 守護官模型經過反復測試和優化,最終實現了 75% 的準确率,能夠識别并标記非法制品圖片。
自 2020 年 " 瀕危物種 AI 守護官 " 部署以來,AI 守護官已經累計篩查了近 36 萬張制品的圖片,并成功标記出了超過 2 萬幅目标制品圖片,促成了近 8 千條非法野生動物貿易信息的删除。在更新的 2.0 版本中, 守護官物種識别範圍從之前的象、虎、穿山甲三類增長為了 29 類,同時它的識别能力、模型、選型、訓練方式以及模型壓縮方式等等都在不斷更新。
一個個數字,點亮的是大模型落地的版圖和路線,也更說明了,如今大模型為代表的人工智能技術的進步,不僅僅是技術的自我超越,更對社會發展有着深遠影響和積極貢獻。
無論是文心飛槳的不斷更新,還是它們在方方面面的實際應用,在這場浪潮中,百度不僅在技術的深度和廣度上尋求突破,更在如何将這些技術轉化為社會發展的動力上不停探索,以此,向 AGI 再邁進一步。