今天小編分享的科技經驗:商湯發布日日新5.0大模型:推理上下文視窗200K,對标GPT-4 Turbo,歡迎閲讀。
IT 之家 4 月 24 日消息,4 月 23 日,商湯科技發布了日日新 5.0 大模型。據介紹,該模型采用 MOE 混合專家架構,在知識、數學、推理和代碼能力方面大幅提升。
該模型基于超過 10TB tokens 訓練,具備 200K 推理上下文視窗(IT 之家注:相當于 36.5 萬個漢字),推理時上下文視窗達到 200K 左右,更号稱 " 全面對标 GPT-4 Turbo"。其提供自然語言處理、圖片生成、自動化數據标注、自定義模型訓練等多種大模型及能力。
文科能力方面,其在創意寫作、推理總結等方面能力均有提升,可為教育、内容產業等垂直應用場景提供輔助;理科能力方面,其數理、代碼及推理等方面能力也進行了增強,官方表示可為金融、數據分析等場景落地提供基礎。
目前,日日新 5.0 大模型已經正式面向全網用户開放,點此直達
商湯方面表示,在小米汽車 SU7 的智能座艙内也應用了商湯大模型技術,小愛同學采用了基于商湯端雲大模型的解決方案,可為車主提供智能化互動體驗。