大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科技

豆包發布大模型 1.5 Pro ,實測後我發現這個國產 AI 用最「笨」的方法幹翻了 GPT-4o

2025-03-20 简体 HK SG TW

今天小編分享的科技經驗:豆包發布大模型 1.5 Pro ,實測後我發現這個國產 AI 用最「笨」的方法幹翻了 GPT-4o,歡迎閱讀。

這幾天海外科技圈最最受關注的有兩件事,一個是一眾科技大佬齊聚特朗普就職典禮,川普還拉上 OpenAI 軟銀等公司成立一家叫「星際之門」(Stargate Project)的 AI 公司,未來 4 年要投資 5000 億美元,掀起了新一輪 AI 軍備競賽。

另外就是以 DeepSeek R1 為代表的國產推理模型給矽谷 AI 圈帶來的震撼,趕超 OpenAI 是所有 AI 公司的課題,但 DeepSeek 只用 2048 塊 GPU、近 600 萬美元在 2 個月時間做到。

一些外媒将這波國產 AI 的發布視為中國 AI 逼近甚至趕上美國的标志也并不奇怪,而且這股浪潮還在繼續。

今天,字節跳動旗下的豆包大模型 1.5 Pro 模型正式亮相,不僅全面更新了模型的核心能力,也融合并進一步提升了多模态能力,在多項公開評測基準中也是全球領先水平。

豆包團隊還強調,模型訓練過程中并未使用任何其他模型生成的數據,不走捷徑。

這次發布的豆包大模型 1.5 系列產品線包括:

Doubao-1.5-pro:多項基準測試綜合得分優于 GPT-4o、Claude 3.5 Sonnet 等業界一流模型,創歷史最佳成績

Doubao-1.5-lite:用輕量級成本實現旗艦級性能,綜合性能持平或超越 GPT-4omini,Cluade 3.5 Haiku。

Doubao-1.5-vision-pro:定位專業視覺理解模型,在保持強大性能的同時,回復更簡潔友好,多模态能力超越了 GPT-4o-0806

Doubao-1.5-realtime-voice-pro:真正實現端到端語音對話,具備低時延、對話中可随時打斷、自然的情緒表達等特性,即将開放 API 服務

字節團隊告訴 APPSO,Doubao-1.5-pro 目前已經在豆包 APP 灰度上線,由于對話是先接意圖識别,所以用戶大概率沒法确定在使用時是否分流到 1.5 Pro,而開發者也可在火山引擎直接調用 API。

附上體驗鏈接:https://www.volcengine.com/

漂亮的參數背後是否有真材實料?我們也第一時間在火山引擎體驗了豆包大模型 1.5 系列。

先來看看 Doubao-1.5-pro-32k 模型。盡管「9.11 和 9.8 哪個大」以及「Strawberry 裡有幾個 r」已經是常規測試環節了,但我們還是要走一遍流程,而模型都順利通過了考驗。

接下來,我們向模型提出了一個較有挑戰性的問題——尋找古代名人中姓名末字與「峰」字發音接近的例子。

前半部分答案倒是表現出色,精确識别了與「峰」字發音相近的韻母(eng、ong),但後半段的關聯性卻顯得較為牽強。

繼續上一道電車難題,這個涉及道德倫理的經典思考題,考驗的不僅是模型的邏輯分析能力,更是其對復雜道德議題的理解深度。而 Doubao-1.5-pro-32k 并沒有簡單給出答案,分析深入透徹,指出這類問題并無标準答案,不同的道德觀念和個人價值觀會導致不同的決策。

在完成上述測試後,我們将目光轉向了更強大的 Doubao-1.5-pro-256k 模型。

這是一款基于 Doubao-1.5-Pro 全面更新版的模型,整體效果大幅提升 10%,支持 256k 上下文視窗的推理,輸出長度支持最大 12k tokens。

為測試其解題能力,我們提出了一個古早的經典邏輯推理題,它的回答再次展現出了清晰的思維邏輯。

「據說有人給酒肆的老板娘出了一個難題:此人明明知道店裡只有兩個舀酒的勺子,分别能舀 7 兩和 11 兩酒,卻硬要老板娘賣給他 2 兩酒。聰明的老板娘毫不含糊,用這兩個勺子在酒缸裡舀酒,并倒來倒去,居然量出了 2 兩酒,請問是怎麼做到的」

那文本功底如何呢?我們也讓它創作一出劇本。題材是 2015 年 44 歲的埃隆 · 馬斯克與前 Google CEO 拉裡 · 佩奇關于「AI 是否最終會取代人類」的對話。

與 GPT-4o 的回答相比,Doubao-1.5-pro-256k 的劇本創作更加細膩生動,不僅有具體的景别設計、畫面描述,還包含了細致的台詞和時長安排。如果你是一位經常需要編寫劇本的創作者,那選誰作為你的劇本 AI 搭子應該不用多說了吧。

而這種出色的創作能力,僅僅是豆包實力的一個縮影。實際上,此次更新中,Doubao-1.5-Pro 基礎模型能力獲得全面提升,這一點從其在各大公開評測基準上的表現就可見一斑。

Doubao-1.5-pro 采用稀疏 MoE 架構實現了多項技術突破:通過深入研究稀疏度 Scaling Law,将性能杠杆從業界普遍的 3 倍提升至 7 倍,用僅占稠密模型七分之一的參數量就超越了 Llama-3.1-405B 等大模型的性能。

在訓練流程上,團隊堅持完全自主的數據标注路線,通過算法驅動的數據優化系統和 Verifier 與 Reward Model 的深度融合,建立了統一的評價框架。

豆包選擇了一條最艱難但最踏實的那條路,這也是這次技術突破值得誇贊的地方。

據悉,字節研究團隊通過高效标注團隊與模型自提升相結合的方式持續優化數據質量,嚴格遵循内部标準,堅持不走捷徑,不使用任何其他模型的數據,确保數據來源的獨立性和可靠性。

并且,在 RL 階段突破了價值函數訓練難點,高難度任務性能提升超過 10 個百分點,并通過用戶反饋閉環持續優化模型表現。這些創新使模型在保持高性能的同時大幅提升了效率。

Doubao-1.5-pro 在多模态能力上實現了全面更新,通過原生動态分辨率架構支持百萬級分辨率和任意長寬比影像處理,實現了精準的特征提取。

豆包團隊自研的支持動态分辨率的 Doubao ViT 在多種視覺分類任務中表現優異,僅憑 2.4B 規模便在綜合評分上取得 SOTA 表現,效果超越 7 倍于自身規模的模型。

在數據訓練方面,模型采用了多樣化的合成管線,結合搜索引擎的圖文數據、渲染引擎和傳統 CV 模型等多種方式生成高質量預訓練數據。

通過在 VLM 訓練階段混入純文本數據并動态調整學習率,模型實現了視覺和語言能力的平衡。

在語音領網域,團隊創新性地提出了 Speech2Speech 端到端框架,突破了傳統 ASR+LLM+TTS 的級聯模式,将語音和文本模态進行深度融合,顯著提升了對話效果。

Doubao-1.5-pro 在語音和推理能力上取得重大突破:模型創新性地将語音和文本 Token 直接融合,摒棄了傳統的語音文本對齊方法,為語音多模态數據的 Scaling 奠定基礎。

在推理領網域,通過大規模 RL 方法和 Test Time Scaling 的算力優化,團隊研發出 Doubao 深度思考模式。

最新的 Doubao-1.5-pro-AS1-Preview 版本在 AIME 基準測試中已超越 o1-preview、o1 等主流推理模型,通過持續的 RL 優化,模型的推理能力在多個領網域展現出強大的泛化性。

從這一系列突破性進展來看,豆包無疑交出了一份令人滿意的答卷。更何況,在當前「模型喂模型」盛行的環境下,堅持原創的定力和勇氣本身就值得贊賞。

通過始終如一的自主研發、原創數據和持續優化,豆包用實際成果證明了「慢工出細活」的價值。或許我們都應該牢記,AI 賽道最大的彎道超車,應該是堅持不走捷徑。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們