今天小編分享的互聯網經驗:殺瘋了!字節豆包視覺理解模型價格下降85%,火山引擎譚待:現在不太關注市場競争,歡迎閱讀。
(圖片來源:钛媒體 AGI 編輯林志佳拍攝)
字節跳動的豆包大模型及相關產品超出預期的表現持續引發行業關注。
钛媒體 AGI 獲悉,12 月 18 日火山引擎 Force 大會上,字節跳動正式發布豆包視覺理解模型、豆包 3D 生成模型,以及全面更新的豆包通用模型 pro、音樂模型、文生圖模型等,為企業提供多模态大模型能力。
值得一提的是,火山引擎總裁譚待宣布,豆包視覺理解模型輸入價格僅為 0.003 元 / 千 tokens,1 塊錢可處理 284 張 720P 的圖片,比行業價格便宜 85%。
會後,譚待對钛媒體 AGI表示,當前字節并不關注市場競争,因為大模型市場仍處于早期階段,更多需要的是場景、需求是否被滿足。長期來看,大模型 C 端和 B 端、虛拟和現實世界場景都應該是齊頭并進發展,而非 " 半頭熱 "。
" 我覺得局部會有一些競争,但這不是關鍵,最關鍵是你能不能把這些東西做好,能把成本做低,能不能把方案、落地應用做好,這樣企業和用戶能夠用起來。我們年初發布大模型,但是你很少聽到業界有誰用起來、用得很好,而 5 月份豆包發了之後,我們首先把成本做了很大降低,效果也做了很大提升,其實這半年大家才能看到更多市場上反饋模型的聲音,在 To b 的領網域,大家都是有競争,也有合作的,我覺得很正常,主要還是大模型價值非常大,空間也非常大,然後還在增長。" 譚待強調,火山引擎就朝着做中國大模型領網域、新的技術變革第一名進行發展。
事實上,在與美國 OpenAI 的競争中,從模型層,到軟硬體協同推進,字節跳動已站穩 AI 大模型頭部地位。今年 11 月的全球月活躍排行榜上,豆包 App 的 MAU(月活躍用戶數)接近 6000 萬,僅次于 OpenAI 的 ChatGPT,位列全球第二;截至目前,豆包大模型日均 tokens 使用量超過 4 萬億,發布 7 個月以來增長超過 33 倍。
同時,字節跳動旗下創作工具剪映和 CapCut,全球月活用戶也已超過 8 億,并且在 2024 年實現收入增長超 100%,總收入接近 100 億元。張楠表示,即夢願景是 " 想象力世界的相機 "。
另外,字節跳動在 AI 人才投入、算力投入、基于扣子的 Agent 智能體、MaaS 等 AI 軟硬體領網域的服務都進行全方位布局。
火山引擎總裁 譚待
那麼,随着 OpenAI 大模型更迭放緩,Scaling Law 和預訓練出現 " 停滞 " 現象,字節跳動能否推動火山引擎成為全球 AI 領網域的新 " 領頭羊 "?
豆包 " 全家桶 " 年末更新,視覺理解模型價格便宜 85%
2024 年聖誕節之前,豆包大模型和相關服務終于迎來今年最後一次的重磅更新,下面钛媒體 AGI 梳理:模型家族、場景示例和價格優勢、豆包大模型應用、火山方舟大模型平台四個部分進行介紹。
1、模型家族:豆包視覺理解模型、豆包 3D 生成模型,以及全面更新的豆包通用模型 pro、音樂模型等。
今天公布的豆包視覺理解模型,目前已經接入豆包 App 和 PC 端產品,支持教育、電商營銷等多個場景,提供極具性價比的多模态大模型能力。豆包視覺理解模型千 tokens 輸入價格僅為 3 厘,一元錢就可處理 284 張 720P 的圖片,比行業價格便宜 85%。
豆包 3D 生成模型,是與火山引擎數字孿生平台 veOmniverse 結合使用,可以高效完成智能訓練、數據合成和數字資產制作,成為一套支持 AIGC 創作的物理世界仿真模拟器。
此外,豆包通用模型 pro 也全面更新,對齊 GPT-4o,使用價格僅為後者的 1/8;音樂模型從生成 60 秒的簡單結構,更新到生成 3 分鍾的完整作品;文生圖模型 2.1 版本,更是在業界首次實現精準生成漢字和一句話 P 圖的產品化能力,該模型已接入即夢 AI 和豆包 App。
此外,钛媒體 AGI 了解到,字節豆包新一代視頻生成大模型将明年 1 月正式提供服務。此外,抖音旗下圖片和視頻生成工具——即夢 AI,也新增新一代圖片生成模型和動态海報功能。
2、場景示例和價格優勢
字節跳動和旗下火山引擎正在加速大模型場景落地。據悉,豆包大模型已經與賽力斯、東風等 80% 主流汽車品牌合作,并接入到多家手機、PC 等智能終端,覆蓋終端設備約 3 億台,來自智能終端的豆包大模型調用量在半年時間内增長 100 倍。
與企業生產力相關的場景,最近 3 個月,豆包大模型在信息處理場景的調用量增長了 39 倍,客服與銷售場景增長 16 倍,硬體終端場景增長 13 倍,AI 工具場景增長 9 倍,學習教育等場景也有大幅增長。
譚待認為,豆包大模型市場份額的爆發,得益于火山引擎 " 更強模型、更低成本、更易落地 " 的發展理念,讓 AI 成為每一家企業都能用得起、用得好的普惠科技。
3、Agent 和豆包大模型應用
此次活動上,豆包 AI Agent 智能體應用成為關注焦點。
火山引擎更新了火山方舟、扣子和 HiAgent 三款平台產品,幫助企業構建好 AI 能力中心,高效開發 AI 應用。
譚待發布了扣子 1.5 版本,支持 GUI 搭建界面,并一鍵發布為小程式、H5、API 等多種應用形态。目前,扣子 1.5 版本已有超過 100 萬活躍開發者,發布超過 200 萬個智能體。
4、火山方舟大模型平台
會上,火山方舟首次發布大模型記憶方案,并推出 prefix cache 和 session cache API,降低延遲和成本,同時火山方舟還新增全網域 AI 搜索,具備場景化搜索推薦一體化、企業私網域信息整合等服務。
基于 AI 雲原生的理念,火山引擎推出了新一代計算、網絡、存儲、安全產品。其中,存儲上,新推出 EIC 彈性極速緩存能實現 GPU 直連,使大模型推理時延降低至 1/50、成本降低 20%。
目前,火山引擎擁有底層基礎設施和技術架構,中層豆包大模型家族,上層火山方舟、扣子、HiAgent 等構建的 AI 應用開發平台,從而形成字節在 AI 領網域的全方位布局和商業落地。
譚待認為,下一個十年,計算範式應該從雲原生進入到 AI 雲原生的新時代。
AI 產業進入 " 深水區 ",火山引擎是否已迎來 "OpenAI 時刻 "?
當前,全球生成式 AI 賽道已經進入了 " 深水區 ",競争激烈,而持續領先的 OpenAI 如今卻開始 " 掉隊 "。
奧爾特曼(Sam Altman)宣布的 12 月 5 日開始為期 12 天的 "OpenAI 12 日 " 活動,已進展到第 9 天,但其新產品的熱度和吸引力,卻都被谷歌的大模型 Gemini2.0、量子計算芯片 Willow、視頻模型 VEO 2 等所取代。
這意味着,ChatGPT 發布兩年之後,谷歌迎來了他的 "OpenAI 時刻 ",技術創新差距越拉越小,且谷歌 AI 視頻模型 VEO 2 效果隐隐超越 Sora。
公開數據顯示,谷歌預計 2024 年每個季度的資本支出都在 120 億美金以上,全年同比增長 49% 以上,主要用于 AI 基礎設施方面;微軟也持續擴大 AI 投資規模,季度資本支出超過 140 億美元;而 Meta 今年全年資本開支從 300 億 -370 億美元上調到 350 億 -400 億美元,以建設數據中心來支持 AI 業務。
因此,随着 Scaling Law 出現放緩,同時谷歌、微軟、Meta 等大科技公司加大對 AI 領網域的資源投入力度,AI 大模型進入了應用和商業落地階段,OpenAI 巨大的產品先發優勢正慢慢消退,大模型與 OpenAI 變得沒有特别大的差距了。
回到國内,自 2023 年起,作為國内雲與智能提供商,字節跳動的火山引擎持續加大在 AI 人才、AI 算力、To B 商業化、AI 智能體應用等多層面、全方位布局。基于豆包大模型更強模型、更易落地、更低價格特點,如今已提供火山方舟大模型服務平台和解決方案,助力客戶提速增效。
2023 年 11 月,字節跳動成立 Flow 部門,Flow 團隊成立後,字節跳動在大模型領網域的架構基本确立,即 Seed 團隊主攻大模型研發領網域;Flow 團隊聚焦于 AI 產品應用開發工作;Stone 團隊承擔技術支持職能。
同時,過去一年,豆包還在國外同步推進 AI 應用布局,持續在全球推出十多款基于 AI 和大模型技術的產品,構建 " 超級 AI 應用工廠 ",實現國内外 AI 模型與應用的 " 雙向復制 "。
(來源:天風證券研究)
如今在 B 端商業化層面,基于豆包大模型的技術能力,火山引擎已經宣布與 30+ 行業外部企業深度共創豆包大模型商業落地,在零售、遊戲、汽車、教育、醫療、企業服務等領網域助力客戶提速增效。
C 端層面,豆包 App 日活 900 萬、月活 6000 萬,已經成為中國消費者首選的 AI 應用。盡管基于大模型訓練此類應用的成本很高,但字節跳動尚未宣布任何将豆包在 C 端商業化的計劃。
譚待對钛媒體 AGI 表示,當前端側 AI 商業化還未完全成熟。" 端模型現在主要靠芯片,芯片現在還不成熟,所以現在讨論這事是為時太早。"
談及 Agent 發展,譚待認為," 從 B 端角度看,當前 Agent 做的其實是不夠的,因為 AGI 的價值在于他能替代、輔助人多長時間的工作,如果他輔助人是一分鍾的工作,比如說幫你寫首打油詩,這個就價值不大。當然智能客服價值是比較大的,而我覺得今年其實還沒有那麼高的 Agent,明年會有一些突破。"
" 我覺得最核心還是技術要好。應該說什麼時候切入,這都是表象,你東西不行,怎麼切都切不進去。因為這個賬很好算,你用人家做的東西,跟我原來用人或用原來系統做的一比較,效果能不能更好,而且成本還能否更低,你就把這個做到了,你怎麼切都切得進去。" 譚待随後補充稱,未來十年,AI 雲原生将是很大的機遇,今天還是初期階段,未來基礎架構會發生變化,從互聯網到 AI 進行眼神," 我想火山應該做成這一領網域的領軍企業。"
譚待曾指出,作為國内第一個把模型成本做到每千 token 低于一厘錢的企業,火山引擎的豆包大模型推動大量的創新應用随之不斷湧現,模型調用量突飛猛進,大家共同努力讓應用的生态更加繁榮。
據研究機構 IDC 預測,到 2030 年,AI 将為全球經濟貢獻 19.9 萬億美元,推動 2030 年全球 GDP 增長 3.5%。這意味着,AI 是全球經濟增長的新引擎。
在演講結尾,譚待強調," 今年是大模型高速發展的一年。當你看到一列高速行駛的列車,最重要的事就是确保自己要登上這趟列車。通過 AI 雲原生和豆包大模型家族,火山引擎希望幫助企業做好 AI 創新,駛向更美好的未來。"
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)