大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

Qwen2.5更新百萬超長上下文,推理速度4.3倍加速,網友:RAG要過時了

2024-11-21 简体 HK SG TW

今天小編分享的科學經驗:Qwen2.5更新百萬超長上下文,推理速度4.3倍加速,網友:RAG要過時了,歡迎閱讀。

國產大模型,最近有點卷。

這不,,Qwen2.5 系列又雙叒突然更新了——

一口氣讀三本《三體》不費事,并且45 秒左右就能完整總結出這 69 萬 token 的主要内容,be like:

還真不是糊弄事兒," 大海撈針 " 實驗顯示,這個全新的Qwen2.5-Turbo在 100 萬 token 上下文中有全綠的表現。

也就是說,這 100 萬上下文裡,有細節 Qwen2.5-Turbo 是真能 100% 捕捉到。

沒錯,Qwen2.5 系列新成員Qwen2.5-Turbo,這回主打的就是支持超長上下文,并且把性價比卷出了花兒:

上下文長度從 128k 擴展到1M,相當于 100 萬個英文單詞或 150 萬個漢字,也就是 10 部長篇小說、150 小時語音記錄、30000 行代碼的量。

更快的推理速度:基于稀疏注意力機制,處理百萬上下文時,首字返回時間從 4.9 分鍾降低到了 68 秒,實現了4.3 倍加速。

關鍵是還便宜:0.3 元 /1M tokens。這意味着,在相同成本下,Qwen2.5-Turbo 可以處理的 token 數量是 GPT-4o-mini 的 3.6 倍。

看到這波更新,不少網友直接爆出了 ***:

有人直言:這麼長的上下文這麼快的速度下,RAG 已經過時了。

還有人開啟大贊特贊模式:現在在開源領網域,Qwen 比 Llama 還值得期待了。

除了一口氣啃下 3 本長篇小說,Qwen 官方還展示了 Qwen2.5-Turbo 超長上下文的更多實用功能。

比如快速掌握一整個代碼庫的信息。

如 Demo 所演示,上傳包含 Qwen-Agent 倉庫中所有代碼檔案的文本檔案(13.3 萬 token),只需幾秒鍾,大模型就能讀完全部代碼并準确輸出各種細節。

用戶:這個存儲庫中有哪些 Agent 子類?提供它們的檔案路徑。

Qwen2.5-Turbo:

一口氣讀 7 篇論文,完成論文分類、論文摘要,也不在話下:

我們也實際測試了一下。可以看到,在沒有給任何提示的情況下,Qwen2.5-Turbo 能準确掌握不同論文的細節信息,并完成對比分析。

除了大海撈針實驗之外,Qwen 團隊還在更復雜的長文本任務上測試了 Qwen2.5-Turbo 的能力。

包括:

RULER:基于大海撈針的擴展基準,任務包括在無關上下文中查找多 " 針 " 或回答多個問題,或找到上下文中出現最多或最少的詞。數據的上下文長度最長為 128K。

LV-Eval:要求同時理解眾多證據片段的基準測試。Qwen 團隊對 LV-Eval 原始版本中的評估指标進行了調整,避免因為過于嚴苛的匹配規則所導致的假陰性結果。數據的上下文長度最長為 128K。

Longbench-Chat:一個評價長文本任務中人類偏好對齊的數據集。數據的上下文長度最長為 100K。

結果顯示,在 RULER 基準測試中,Qwen2.5-Turbo 取得了93.1 分,超過了 GPT-4o-mini 和 GPT-4。

在 LV-Eval、LongBench-Chat 等更接近真實情況的長文本任務中,Qwen2.5-Turbo 在多數維度上超越了 GPT-4o-mini,并且能夠進一步擴展到超過 128 tokens 上下文的問題上。

值得一提的是,現有的上下文長度擴展方案經常會導致模型在處理短文本時出現比較明顯的性能下降。

Qwen 團隊也在短文本任務上對 Qwen2.5-Turbo 進行了測試。

結果顯示,Qwen2.5-Turbo 在大部分任務上顯著超越了其他上下文長度為 1M tokens 的開源模型。

和 GPT-4o-mini 以及 Qwen2.5-14B-Instruct 相比,Qwen2.5-Turbo 在短文本任務上的能力并不遜色,但同時能 hold 住 8 倍于前兩個模型的上下文。

此外,在推理速度方面,利用稀疏注意力機制,Qwen2.5-Turbo 将注意力部分的計算量壓縮到了原來的 2/25,在不同硬體配置下實現了 3.2-4.3 倍的加速比。

現在,在 HuggingFace 和魔搭社區,Qwen2.5-Turbo 均提供了可以在線體驗的 Demo。

API 服務也已上線阿裡雲大模型服務平台,跟 OpenAI API 是兼容的。

至于模型權重什麼時候開源?

阿裡通義開源負責人林俊旸的說法是:目前還沒有開源計劃,但正在努力中。

反正 HuggingFace 聯合創始人 Thomas Wolf 是幫咱催上了(手動狗頭)。

Demo 傳送門:

https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo

https://www.modelscope.cn/studios/Qwen/Qwen2.5-Turbo-1M-Demo

參考鏈接:

https://qwenlm.github.io/zh/blog/qwen2.5-turbo/

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們