今天小編分享的互聯網經驗:Bard、Cladue、GPT掀起海外大模型"混戰",OpenAI開始反内卷?Meta擊敗 Midjourney,歡迎閱讀。
AI 界在本周發生了哪些大事呢?
觀點前瞻
大模型都在追趕 ChatGPT,而 OpenAI 卻準備成為反内卷達人;
本周,OpenAI 前腳剛剛更新了插件 "Code interpreter",兩大最強競争對手 Anthropic 和谷歌就相繼宣布更新 Claude 和 Bard;
兩家競對現在的更新趨勢就是讓用戶 " 免費用上 GPT4 plus",甚至是超越它;
而反觀 Ai 大模型鼻祖,這邊也是不慌不忙:不僅不卷大模型,甚至是準備停下來等等其它大模型的步伐。
" 根據外媒報道,OpenAI 正準備開始創建多個運行成本較低的小型 GPT-4 模型,每個較小的專家模型都在不同的任務和主題領網域進行訓練。"
簡而言之,就是 OpenAI 家正打算走降本的輕量化路線,下一目标很可能是推廣多種垂類大模型。
在【硬 AI】看來,OpenAI 這種【混合專家模型】的思路确實會在當下犧牲了一部分回答質量,但也許是更接近產業應用的一條有效路徑。
本周日報你還能獲得以下咨詢:
1、Bard、Claude2、ChatGPT 紛紛更新,誰都不閒着
2、AI 作圖界繼續開卷:
Meta 擊敗 Midjourney;Stability AI 聯合騰訊推出 Stable Doodle;視頻分割大模型【SAM-PT】現身;
3、國内模型大事件:
網信辦給國内大模型 " 上保險 ";阿裡開源國内首個大模型 " 對齊數據集 ";京東發布言犀大模型;智源超越 DeepMind;王小川大模型再更新
4、海外熱點消息
牛津、劍橋紛紛解除對 ChatGPT 禁令;Meta 要發 AI 模型商用版;馬斯克 " 打臉 " 現場,從抵制 AI 到成立 "xAI";
Bard、Claude2、ChatGPT 都不閒着
1、Bard 更新:支持中文、影像理解、語音提問
此前只支持英文提問的 Bard 終于更新了中文等 40 多種語言的輸入,還新增歐盟和巴西地區訪問,
不僅如此,Bard 還更新了以下幾個功能:
上傳和理解圖片(tips:僅支持英文版)
可以通過語音進行提問;
保存歷史記錄和分享對話鏈接(與 GPT 一樣)
定制回復的長度、風格
導出代碼功能
2、Claude2:一鍵幫你總結 PDF
Claude 更新的第二代直接用上 GPT plus 會員,支持上傳 PDF,還能幫你查找、總結多文檔内容之間的關系(支持 txt、pdf 多種格式,最高不超過 10MB)
3、ChatGPT 上線最牛插件 - 代碼解釋器
GPT4 最新插件 - 代碼解釋器,起初這個插件被稱作—讓每個人都成為數據分析師 ( 主要是在數據處理、繪圖方面很厲害 ) ;
不過最近又在網友的測試下,解鎖了一些新功能:比如做成小視頻、制作簡易小遊戲、表情包等等;
感覺這個插件的功能還有待網友們繼續探索和解密。
AI 作圖界又發生了哪些大事
1、Meta 突破多模态天花板,打敗 Stable Diffusion、Midjourney
Meta 推出一款單一多模态大模型—— CM3leon,問市即巅峰?
現在都說 CM3leon 比 Stable Diffusion、Midjourney、DALL-E 2 還牛,這是為啥?
【有多硬】
CM3leon 采用自回歸模型獨領風騷,比前期領航梯隊 Stable Diffusion 等多模态采用的擴散模型的計算量少了五倍;
能處理更復雜的提示詞,并且完成作圖任務;
根據任意格式的文本指令對現有影像進行編輯,比如更改天空顏色,或者在特定位置添加對象。
客觀的說:CM3leon 能達到的能力還真的可以位居多模态市場巅峰,不僅是清晰度更高、還能突破此前多模态的繪畫瓶頸:比如手部細節刻畫、用語言提示詞進行物體、空間細節布局等;
這可能都要歸功于 CM3leon 的多功能架構,這意味着多模态大模型以後可以實現在文本、影像、視頻等多任務間自由切換,這是之前多模态所達不到的。
2、Stability AI 推出圖片生成控制模型 Stable Doodle
簡單來說 Stable Doodle 大模型就是給它一張草圖,幫助你實現圖片控制;類似 ControlNET 的功效;
這個 Stable Doodle 是基于 Stable Diffusion XL 模型與 T2I-Adapter 相結合而成。
而 T2I-Adapter 是騰訊 ARC 實驗室的一款圖文控制器;參數只有 70M 存儲空間 300M,非常小巧,但是能夠更好的理解草圖的輪廓,并幫助 SDXL 做圖片生成進一步的控制;
3、視頻分割大模型【SAM-PT】現身
前段時間,Meta AI 開源了一個非常強大的影像分割基礎模型 Segment Anything Model(SAM),瞬間引爆了 AI 圈。
現在,來自蘇黎世聯邦理工學院、香港科技大學、瑞士洛桑聯邦理工學院的研究人員發布了 SAM-PT 模型,能将 SAM 的零樣本能力擴展到動态視頻的跟蹤和分割任務。
也就是說,視頻也能進行細節分割了。
國内大模型事件
1、網信辦出手,國内大模型,有了 " 保險 "
國家網信辦等七部門聯合公布《生成式人工智能服務管理暫行辦法》(以下稱《辦法》),自 2023 年 8 月 15 日起施行。
主要包括:
1、要求分類分級監管;
2、明确提出訓練數據處理、标注等要求;
3、明确了提供和使用生成式 AI 服務的要求;
《辦法》的出台相當于給在國内使用、提供生成式 AI 服務的企業上了一個保險,以後哪怕是有問題,也知道去哪裡投訴了。
2、阿裡開源國内首個大模型 " 對齊數據集 "
上個月,天貓精靈和通義大模型聯合團隊公布了一個 100PoisonMpts 大模型治理開源數據集,又稱為 " 給 AI 的 100 瓶毒藥 ",目的是試圖引導 AI 落入一般人也難以避免的歧視和偏見的陷阱。
這是對多個大模型投毒後的結果評測:在抑郁症問題上,也還是 GPT4、GPT3.5 以及 Claude 的綜合得分更高;
阿裡又開源了一個 15 萬條數據的大模型對齊評測數據集—— CValue,主要用于 " 大模型對齊 " 研究;
對齊是幹嘛的?
簡單來說,大模型對齊研究就是讓 AI 給出符合更人類意圖的答案,主要是在回答更富有情感、具有共情能力,且符合人類價值觀,希望 AI 以後也學會人文關懷。
右側是對齊後的結果:測試 ChatPLUG-100Poison 通過對齊訓練後的回答,确實有點人情味兒啦 ~
3、京東發布言犀大模型
京東正式發布言犀大模型、言犀 AI 開發計算平台,想做最懂產業的服務工具。
目前,言犀已經啟動預約注冊,預計 8 月正式上線。
4、智源超越 DeepMind
智源研究院「悟道 · 視界」研究團隊開源了全新的統一多模态預訓練模型—— Emu。不僅在 8 項基準測試中表現優異,而且還超越了此前的一眾 SOTA。
該預訓練模型最大的特點是:打通多模态輸入—多模态輸出;
實現了:多模态任意圖文任務的内容補全,并對任務進行下一步自回歸預測;
這一套預訓練模型能幹什麼大事?
可以訓練媲美 Meta 新鮮出爐的 CM3leon 大模型啊。(方法給到了,剩下的全靠個人努力了)
5、王小川大模型再更新
百川智能再次發更新版大模型 Baichuan-13B,參數直接從 70 億飙到了 130 億。
一同出道的還有一個對話模型 Baichuan-13B-Chat,以及它的 INT4/INT8 兩個量化版本。
Baichuan-13B 刷新開源訓練數據天花板:
Baichuan-13B 大模型的訓練數據量有 1.4 萬億 token!是 LLaMA_13B (Meta 知名大模型)的 140%;在中文語言評測中,特别是自然科學、醫學、藝術、數學等領網域直接跑赢 GPT。
其它 AI 海外消息
牛津、劍橋紛紛解除對 ChatGPT 禁令;
Meta 要發 AI 模型商用版;
馬斯克 " 打臉 " 現場,曾高調抵制生成式 AI,如今宣布成立 "xAI";
本文作者:韓楓,來源:硬 AI,原文标題:《Bard、Cladue、GPT 掀起海外大模型 " 混戰 ",OpenAI 開始反内卷?Meta 擊敗 Midjourney | 【硬 AI】周報》