大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

小扎回應Llama 4對比DeepSeek:開源榜單有缺陷,等17B深度思考模型出來再比

2025-05-01 简体 HK SG TW

今天小編分享的科學經驗:小扎回應Llama 4對比DeepSeek:開源榜單有缺陷,等17B深度思考模型出來再比,歡迎閲讀。

Meta 首屆 LlamaCon 開發者大會開幕,扎克伯格在期間接受采訪,回應大模型相關的一切。

包括 Llama4 在大模型競技場表現不佳的問題:

開源基準測試存在缺陷,常偏向特定不常見用例,與產品實際使用場景脱節,不能真實反映模型的優劣。

試圖為這類東西進行過多優化會誤入歧途。

對于我們團隊來説,搞一個衝到榜單頂部的 Llama 4 Maverick 版本相對容易,但是我們發布的版本根本沒有對此進行調優,排名靠後是正常的。

以及與 DeepSeek 的比較:

我們的推理模型還沒有出來,所以還沒有和 R1 相應的模型去對比。

與此同時,在 Meta 合作夥伴亞馬遜的網站代碼中,被扒出要即将推出的 Llama4 推理模型為 17B 參數的 llama4-reasoning-17b-instruct。

活動期間,有那麼點 Meta 不語,只是一味地抛出 Llama 系列 " 亮點 " 的意思了(doge):

除即将推出超 2 萬億參數的 Llama 4 Behemoth 模型之外,代号 "Little Llama" 的 80 億參數小模型可能會在未來幾個月推出。

推出官方 Llama API 平台

推出一系列 AI 安全工具,包括檢測和防止提示注入、越獄等風險。

扎克伯格談 " 智能爆炸 "

扎克伯格認為随着軟體工程和 AI 研究的自動化推進,智能爆炸具備實現的可能性。從技術發展趨勢來看,AI 寫代碼能力不斷提升,預計未來 12-18 個月,大部分相關代碼将由 AI 完成。

這不僅意味着開發效率的大幅提高,還可能帶來代碼質量的提升,因為 AI 能夠基于大量的數據和先進的算法,生成更優化、更高效的代碼。

然而真正達到智能爆炸還面臨着諸多現實層面的制約。在物理基礎設施上,構建大規模計算集群復雜且耗時,從研發到穩定應用需要一定時間,同時還需要配套建設網絡設施,确保數據的高速傳輸;建設專門的數據中心場地,要經過嚴格的審批流程;解決能源供應問題,無論是采用傳統的燃氣輪機發電還是綠色能源,都涉及到復雜的供應鏈體系,這些環節都需要耗費大量的時間和資源。

在人機協同方面,人們對 AI 系統的适應和反饋同樣需要時間。AI 系統并非一經推出就能被用户熟練使用,而是需要一個相互學習的過程。用户在使用過程中逐漸掌握與 AI 互動的方式,AI 則通過分析用户的行為和反饋,不斷優化自身的功能和性能。

在 Meta 廣告團隊的自動化排序實驗中,盡管有大量的測試想法,但由于計算資源的限制,無法對所有假設進行充分測試;同時,為了保證測試結果的準确性和可靠性,需要大量的測試人力,這也在一定程度上限制了實驗的推進速度。

扎克伯格認為,人們已經開始與 AI 建立起多種類型的關系,如将 AI 作為治療師傾訴或朋友分享生活等,產品開發者應該尊重用户的選擇。

雖然現階段這類 AI 人際關系相關的產品在技術實現上還不夠成熟,比如虛拟治療師或朋友的形象往往只是簡單的圖片或粗糙的動畫,缺乏真實的互動感,但随着技術的不斷進步,為提升虛拟形象的真實感和互動性帶來了新的可能。

換句話説,AI 和元宇宙戰略在未來還有聯動效應。

在產品設計理念上,避免過度幹擾用户是關鍵原則。Meta 的 Orion 眼鏡設計目标不僅僅是集成各種先進的技術功能,更重要的是要成為一副好用的日常眼鏡。在不使用 AI 功能時,它要能像普通眼鏡一樣滿足用户的基本需求,如佩戴舒适、外觀美觀;當用户需要使用 AI 功能時,又能便捷地提供服務,如語音互動、信息展示等。

這種設計理念同樣适用于增強現實未來的產品設計,即讓物理世界和數字世界自然融合,在為用户提供豐富數字内容的同時,避免數字元素過度充斥用户的視野,造成視覺和心理上的負擔。

最後,扎克伯格回答了 " 如果軟體生產力在兩年内提高 100 倍 " 會怎麼樣。

他認為從歷史看,過去全人類大部分精力都用于養活自己,也就是從事農業為主。最近 100 多年來滿足基本身體需求在人類精力中的占比越來越小。

這種轉變有兩個影響:一個是越來越多的人在追求創意和文化。第二是人們花在工作上的時間更少,而花在娛樂和文化上的時間更多。

但随着時間的推移,如果每個人都擁有這些超人類工具來創造大量不同的東西,就會出現令人難以置信的多樣性。其中一部抽成果将用于解決難題:攻克疾病、推動科學進步、開發讓我們生活更美好的新技術。

Llama 首次推出官方 API

此前 Meta 只管開源模型,部署托管各憑本事,現在終于推出官方 API 平台。

提供微調和評估 Llama 模型性能的工具。

新型芯片供應商 Cerebras 和 Groq 合作,提供高推理速度的選項。

承諾不會使用客户數據來訓練自己的模型。

目前屬于邀請測試階段,需要排隊。

不過手快的開發者在會場上就把 Demo 做出來了。

利用多模态能力,描述相機拍到的畫面,整體上描述準确,不過其實這根香蕉是玩具,對 AI 來説還是難了。

Llama API:

https://www.llama.com/products/llama-api/#llama-protections

Demo 試玩:

https://llama-api-launch.craigsdemos.workers.dev

參考鏈接:

[ 1 ] https://www.dwarkesh.com/p/mark-zuckerberg-2

[ 2 ] https://x.com/craigsdennis/status/1917365062165225544

[ 3 ] https://x.com/btibor91/status/1917232574344384522

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—  完  —

點亮星标

科技前沿進展每日見

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們