Reflection 70B AI 模型第三方基準測試結果不佳 - 大酷樂

今天小編分享的科技經驗：Reflection 70B AI 模型第三方基準測試結果不佳，歡迎閱讀。

IT 之家 9 月 11 日消息，科技媒體 The Decoder 昨日（9 月 10 日）報道，對比平台 Artificial Analysis 相關數據表明，Reflection 70B AI 模型在基準測試中的表現，實際上不及 Meta 的 LLaMA-3.1-70B。

針對 AI 模型基準測試結果不佳，Reflection 公司首席執行官馬特・舒默（Matt Shumer）表示，上傳模型權重至 Hugging Face 時遇到問題，所使用的權重是多個不同模型的混合體，而他們内部托管的模型則顯示出更佳的結果。

舒默随後向部分用戶提供了獨家訪問内部模型的權限，Artificial Analysis 重做了測試，并報告結果優于公開 API，只是他們無法确認所訪問的具體是哪個模型。

Reflection 在 Hugging Face 已上傳了新的模型，不過這些模型在測試中的表現明顯遜于之前通過私有 API 提供的模型。

IT 之家查詢公開資料，有用戶還發現了證據，表明 Reflection API 有時會調用 Anthropic Claude 3.5 Sonnet 以及 OpenAI。

舒默旗下公司 OthersideAI 此前已宣布計劃于本周發布一款基于 LLaMA 3.1 450B 的更大、更強大的模型。

舒默對這一即将發布的版本做出了大膽聲明，稱其不僅将成為最佳的開源模型，還将是有史以來最優秀的語言模型。

官方回應：

熱門排行

2025 款長城哈弗 H5 四款配色公布，魅影黑、謝飛揚 | 2025-03-10
最賺錢的縣城特產，都在背着本地人生產衛青柏 | 2025-03-10
李源一當初為何落選國足？東體：外界看來一頭霧甄正浩 | 2025-03-10
匯頂科技：公司總裁胡煜華因個人原因辭職繁綺文 | 2025-03-10
走過路過不要錯過！奧斯梅恩“流浪”土超21場嬴覓晴 | 2025-03-10
楊幂為劉詩詩慶生，牽出背後3次互撕恩怨，這是衛青柏 | 2025-03-10
雙核驅動！車子2.4億打造雙後腰：凱塞多+恩佐，一衛青柏 | 2025-03-10
2025中國AI“奇點”已至？摩根大通：應用井噴在賁芳蕤 | 2025-03-10
拒絕字節跳動3000萬美金收購，Manus是DeepSee 集玲琳 | 2025-03-10
Costco增長強勁，但暗示着美國再通漲？佼昌翰 | 2025-03-10
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
曹操墓，裡面都有啥？衛青柏 | 2023-05-02
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
解除資格！停止一切合作佼昌翰 | 2023-05-02
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
200戶連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容溫柔郜萌運 | 2023-05-02