今天小編分享的科學經驗:小扎回應Llama 4對比DeepSeek:開源榜單有缺陷,等17B深度思考模型出來再比,歡迎閱讀。
Meta 首屆 LlamaCon 開發者大會開幕,扎克伯格在期間接受采訪,回應大模型相關的一切。
包括 Llama4 在大模型競技場表現不佳的問題:
開源基準測試存在缺陷,常偏向特定不常見用例,與產品實際使用場景脫節,不能真實反映模型的優劣。
試圖為這類東西進行過多優化會誤入歧途。
對于我們團隊來說,搞一個衝到榜單頂部的 Llama 4 Maverick 版本相對容易,但是我們發布的版本根本沒有對此進行調優,排名靠後是正常的。
以及與 DeepSeek 的比較:
我們的推理模型還沒有出來,所以還沒有和 R1 相應的模型去對比。
與此同時,在 Meta 合作夥伴亞馬遜的網站代碼中,被扒出要即将推出的 Llama4 推理模型為 17B 參數的 llama4-reasoning-17b-instruct。
活動期間,有那麼點 Meta 不語,只是一味地抛出 Llama 系列 " 亮點 " 的意思了(doge):
除即将推出超 2 萬億參數的 Llama 4 Behemoth 模型之外,代号 "Little Llama" 的 80 億參數小模型可能會在未來幾個月推出。
推出官方 Llama API 平台
推出一系列 AI 安全工具,包括檢測和防止提示注入、越獄等風險。
扎克伯格談 " 智能爆炸 "
扎克伯格認為随着軟體工程和 AI 研究的自動化推進,智能爆炸具備實現的可能性。從技術發展趨勢來看,AI 寫代碼能力不斷提升,預計未來 12-18 個月,大部分相關代碼将由 AI 完成。
這不僅意味着開發效率的大幅提高,還可能帶來代碼質量的提升,因為 AI 能夠基于大量的數據和先進的算法,生成更優化、更高效的代碼。
然而真正達到智能爆炸還面臨着諸多現實層面的制約。在物理基礎設施上,構建大規模計算集群復雜且耗時,從研發到穩定應用需要一定時間,同時還需要配套建設網絡設施,确保數據的高速傳輸;建設專門的數據中心場地,要經過嚴格的審批流程;解決能源供應問題,無論是采用傳統的燃氣輪機發電還是綠色能源,都涉及到復雜的供應鏈體系,這些環節都需要耗費大量的時間和資源。
在人機協同方面,人們對 AI 系統的适應和反饋同樣需要時間。AI 系統并非一經推出就能被用戶熟練使用,而是需要一個相互學習的過程。用戶在使用過程中逐漸掌握與 AI 互動的方式,AI 則通過分析用戶的行為和反饋,不斷優化自身的功能和性能。
在 Meta 廣告團隊的自動化排序實驗中,盡管有大量的測試想法,但由于計算資源的限制,無法對所有假設進行充分測試;同時,為了保證測試結果的準确性和可靠性,需要大量的測試人力,這也在一定程度上限制了實驗的推進速度。
扎克伯格認為,人們已經開始與 AI 建立起多種類型的關系,如将 AI 作為治療師傾訴或朋友分享生活等,產品開發者應該尊重用戶的選擇。
雖然現階段這類 AI 人際關系相關的產品在技術實現上還不夠成熟,比如虛拟治療師或朋友的形象往往只是簡單的圖片或粗糙的動畫,缺乏真實的互動感,但随着技術的不斷進步,為提升虛拟形象的真實感和互動性帶來了新的可能。
換句話說,AI 和元宇宙戰略在未來還有聯動效應。
在產品設計理念上,避免過度幹擾用戶是關鍵原則。Meta 的 Orion 眼鏡設計目标不僅僅是集成各種先進的技術功能,更重要的是要成為一副好用的日常眼鏡。在不使用 AI 功能時,它要能像普通眼鏡一樣滿足用戶的基本需求,如佩戴舒适、外觀美觀;當用戶需要使用 AI 功能時,又能便捷地提供服務,如語音互動、信息展示等。
這種設計理念同樣适用于增強現實未來的產品設計,即讓物理世界和數字世界自然融合,在為用戶提供豐富數字内容的同時,避免數字元素過度充斥用戶的視野,造成視覺和心理上的負擔。
最後,扎克伯格回答了 " 如果軟體生產力在兩年内提高 100 倍 " 會怎麼樣。
他認為從歷史看,過去全人類大部分精力都用于養活自己,也就是從事農業為主。最近 100 多年來滿足基本身體需求在人類精力中的占比越來越小。
這種轉變有兩個影響:一個是越來越多的人在追求創意和文化。第二是人們花在工作上的時間更少,而花在娛樂和文化上的時間更多。
但随着時間的推移,如果每個人都擁有這些超人類工具來創造大量不同的東西,就會出現令人難以置信的多樣性。其中一部抽成果将用于解決難題:攻克疾病、推動科學進步、開發讓我們生活更美好的新技術。
Llama 首次推出官方 API
此前 Meta 只管開源模型,部署托管各憑本事,現在終于推出官方 API 平台。
提供微調和評估 Llama 模型性能的工具。
新型芯片供應商 Cerebras 和 Groq 合作,提供高推理速度的選項。
承諾不會使用客戶數據來訓練自己的模型。
目前屬于邀請測試階段,需要排隊。
不過手快的開發者在會場上就把 Demo 做出來了。
利用多模态能力,描述相機拍到的畫面,整體上描述準确,不過其實這根香蕉是玩具,對 AI 來說還是難了。
Llama API:
https://www.llama.com/products/llama-api/#llama-protections
Demo 試玩:
https://llama-api-launch.craigsdemos.workers.dev
參考鏈接:
[ 1 ] https://www.dwarkesh.com/p/mark-zuckerberg-2
[ 2 ] https://x.com/craigsdennis/status/1917365062165225544
[ 3 ] https://x.com/btibor91/status/1917232574344384522
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
點亮星标
科技前沿進展每日見