今天小編分享的财經經驗:周鴻祎談“百模大戰”:彎道超車的關鍵在發展多模态,歡迎閱讀。
本文來源:時代周報 作者:唐洛
" 作為搜索引擎廠商,我們發展大模型不該是等到 ChatGPT 火了才跟進。"6 月 13 日,在三六零(601360.SH,以下稱 "360")智腦大模型發布會現場,創始人周鴻祎在談到大模型行業時說道。
周鴻祎繼續稱,包括 360 在内的搜索引擎公司,都應該抽自己耳光,因為早在多年前就開始發展大模型,但只顧解決眼前問題,忙着做場景結合," 如果那個時候有員工提出要做通用型人工智能,我想無論是周總、李總還是馬總,給出的答案都是:滾一邊去。" 在他看來,應該感謝 OpenAI 的執着,給整個 AI 行業指明了正确的方向。
對于國内大模型和國際上的差距,周鴻祎也表達了信心。" 原先我曾說國内大模型和國際差距有一兩年,現在我收回這句話,中國大模型的發展速度已經基本趕上國際先進水平,整體的基本水平已經趕上 GPT-3.5,追趕 GPT-4 的速度也超過自己的想象。"
周鴻祎提到,今年年初,在 ChatGPT 發布後,中國已經進入百模大戰,各家企業都發布了自己的大模型產品,這三個月相當于人工智能行業過去的三十年。
在這場發布會上,周鴻祎把下半場的重點放在了 360 智腦大模型的多模态能力和應用場景上。360AI 數字人背後是 "360 智腦 4.0",提供多模态能力支撐。周鴻祎表示,GPT 時代中國自研大模型彎道超車的關鍵在于發展多模态。
國内首發 " 文生視頻 " 多模态能力
當天,360 發布了旗下 "360 智腦大模型 " 的 4.0 版本。周鴻祎表示,4.0 版本有三個關鍵詞:多模态、全端應用、數字人。
周鴻祎介紹,認知型通用大模型 "360 智腦 4.0" 具備生成與創作、多輪對話、代碼能力、邏輯與推理、知識問答、閱讀理解、文本分類、翻譯、文本改寫、多模态(文本生成影像)十大核心能力。這十大核心能力已通過中國信通院 " 可信 AIGC 大語言模型基礎能力 " 評估。360 智腦是國内首個通過中國信通院該項權威評估的大模型產品。
"OpenAI 的 ChatGPT 最先體現出強大的文字生成能力,中國企業追趕 GPT 大模型的速度很快,目前各家企業在文字生成方面的能力已經實現國際領先。預計 GPT-5 全面支持多模态能力,中國自研大模型彎道超車的關鍵在于發展多模态能力。" 周鴻祎稱,在多模态方面,360 已具備跨模态生成能力,包括文生文、文生圖、文生表、圖生圖、圖生文、視頻理解等功能。
他進一步解釋,多模态能力是給大模型增加上眼睛、耳朵、鼻子、嘴巴,而不僅僅只有大腦。下一步,360 計劃将 360 智腦更新到 5.0 版本,并發布插件平台,安裝上插件是要讓它有手和腳的能力,這樣大模型的能力才能發揮出來。" 當大語言模型有了多模态能力之後,它獲得的知識就不僅僅來自于文字的知識,可以來自于圖片,來自于視頻。" 周鴻祎說。
值得注意的是,360 此次還發布了 " 文生視頻 " 的功能,可以使用任何文字腳本生成視頻,這也是國内大模型廠商首次發布此類功能。周鴻祎在現場實時演示了 360 智腦是如何做出一段 " 無中生有 " 的視頻,他用文字指令要求 360 智腦生成熊貓劃船、企鵝在沙漠中洗澡的視頻,就在幾秒之後,就生成了一段頗為真實的視頻。
AI 數字人也是 360 本次重點發布的新產品。在發布會現場,周鴻祎與諸葛亮、孫悟空、馬斯克等數字人開展實時對話問答。
其中,周鴻祎詢問了 " 馬斯克 " 關于 " 中國電動車產業是否對你構成威脅 "、" 如何評價推特公司 "" 火箭發射失敗,對你是否是重大打擊 " 等問題。
目前,360 的 AI 數字人擁有 200 多個角色,分為數字名人和數字員工兩類。數字名人包括歷史人物、偶像明星、文學形象等,讓用戶在與數字人的開放對話中實現與偶像的近距離接觸,與先賢的思想交流。數字員工則可成為企業員⼯的知識助⼿和辦公助手,提升企業運營效能。
此外,AI 數字人還支持定制,生成自己的專屬數字人。周鴻祎在現場創建了自己的數字人,作為 360 的發言人," 說對了算我的,說錯了算他的。"
在周鴻祎看來,在未來的人工智能大模型的應用環節,數字人将成為人機對話的全新入口," 區别于傳統數字人只能按既定腳本輸出内容,360AI 數字人的特點在于有記憶、有人設和性格,能夠復刻思維方式和人生經歷,是有靈魂的數字人。"
" 我希望有一天當我要讨論一個新產品的時候,我能跟馬斯克、喬布斯、諸葛亮的數字人坐在一起,讓大家對我的產品提一些建議。設想一下,如果有多個數字人,有不同的人設,不同的經歷,背後都是人工智能在驅動,讓他們一起來幫你做腦力激蕩,一起來跟你完成共同的目标。" 周鴻祎覺得,這是智腦一個更大的提升,也是 360 提出的 "one more thing"。
" 百模大戰 "
當下,人工智能領網域鮮花着錦,諸多大模型争相問世,如京東 chatJD 大模型、百度文心大模型、阿裡通義大模型等。科技部新一代人工智能發展研究中心日前發布的《中國人工智能大模型地圖研究報告》顯示,中國 10 億參數規模以上的大模型已發布 79 個。
但各家都有自己擅長的領網域,成熟的業務矩陣,且都是先拿自家的業務當做 " 試金石 ",呈現的結果自然不同。比如阿裡雲将通義千問接入辦公軟體 " 釘釘 ",可自動生成群聊摘要、輔助内容創作、總結會議紀要;百度的文心一言,将 B 端 " 生态圈 " 作為宣傳和業務重點;華為雲盤古大模型提出了 "AI for Industries" 理念。
360 智腦則是融合多模态能力,試圖做出一個真正的 AI 數字人。周鴻祎認為,多模态是 360 智腦在 " 百模大戰 " 中突圍的重要路徑。
在他看來,百度、騰訊、頭條、阿裡、360 都會在自己的固有場景裡把自己的 AI 能力賦能。接下來真正比拼的是應用落地的能力,要思考如何讓個人和企業更方便、簡單地使用 AI 大模型應用。" 大模型的價值不僅僅在于互聯網場景,而是把大模型能力通用化、泛化、垂直化,和不同行業、不同企業具體的業務需求深度地融合。這樣的產業機會實際上才剛剛開始,未來至少有 10 年的紅利時期。" 周鴻祎說。
目前,360 智腦 4.0 版本已接入 360 全端產品,包括搜索、360 浏覽器、360 安全衛士等。随着大模型開放内測、應用場景的逐步落地,AI 賦能的或許遠不只是產品本身。
" 人工智能的理念還是應該以人為本。我們無論做出多麼強大的人工智能,都是在為人類做有史以來最好的工具。通過工具的賦能,讓個人、公司、機構都能真正地提高勞動生產率。" 周鴻祎覺得,大模型應該成為人類的朋友和助手。