今天小編分享的科技經驗:字節跳動發布豆包視覺理解、3D生成等新模型:每千tokens輸入3厘,歡迎閱讀。
IT 之家 12 月 18 日消息,IT 之家從字節跳動官方獲悉,在今日的火山引擎 Force 大會上,字節跳動正式發布豆包視覺理解模型,為企業提供多模态大模型能力。豆包視覺理解模型千 tokens 輸入價格僅為 3 厘,一元錢就可處理 284 張 720P 的圖片,官方宣稱比行業價格便宜 85%。
豆包 3D 生成模型也在本次活動中正式亮相。将其與火山引擎數字孿生平台 veOmniverse 結合使用,可完成智能訓練、數據合成和數字資產制作,官方稱之為 " 一套支持 AIGC 創作的物理世界仿真模拟器 "。
豆包大模型旗下多款產品也迎來了更新:
豆包通用模型 pro:全面對齊 GPT-4o,使用價格僅為後者的 1/8;
音樂模型:可生成 3 分鍾的完整作品;
文生圖模型 2.1 版本:精準生成漢字、一句話 P 圖,已接入即夢 AI 和豆包 App。
此外,豆包将于明年春季推出具備更長視頻生成能力的豆包視頻生成模型 1.5 版,豆包端到端實時語音模型也将很快上線,從而解鎖多角色演繹、方言轉換等新能力。