Bard、Cladue、GPT掀起海外大模型"混戰"，OpenAI開始反内卷？Meta擊敗 Midjourney

今天小編分享的互聯網經驗：Bard、Cladue、GPT掀起海外大模型"混戰"，OpenAI開始反内卷？Meta擊敗 Midjourney，歡迎閱讀。

AI 界在本周發生了哪些大事呢？

觀點前瞻

大模型都在追趕 ChatGPT，而 OpenAI 卻準備成為反内卷達人；

本周，OpenAI 前腳剛剛更新了插件 "Code interpreter"，兩大最強競争對手 Anthropic 和谷歌就相繼宣布更新 Claude 和 Bard；

兩家競對現在的更新趨勢就是讓用戶 " 免費用上 GPT4 plus"，甚至是超越它；

而反觀 Ai 大模型鼻祖，這邊也是不慌不忙：不僅不卷大模型，甚至是準備停下來等等其它大模型的步伐。

" 根據外媒報道，OpenAI 正準備開始創建多個運行成本較低的小型 GPT-4 模型，每個較小的專家模型都在不同的任務和主題領網域進行訓練。"

簡而言之，就是 OpenAI 家正打算走降本的輕量化路線，下一目标很可能是推廣多種垂類大模型。

在【硬 AI】看來，OpenAI 這種【混合專家模型】的思路确實會在當下犧牲了一部分回答質量，但也許是更接近產業應用的一條有效路徑。

本周日報你還能獲得以下咨詢：

1、Bard、Claude2、ChatGPT 紛紛更新，誰都不閒着

2、AI 作圖界繼續開卷：

Meta 擊敗 Midjourney；Stability AI 聯合騰訊推出 Stable Doodle；視頻分割大模型【SAM-PT】現身；

3、國内模型大事件：

網信辦給國内大模型 " 上保險 "；阿裡開源國内首個大模型 " 對齊數據集 "；京東發布言犀大模型；智源超越 DeepMind；王小川大模型再更新

4、海外熱點消息

牛津、劍橋紛紛解除對 ChatGPT 禁令；Meta 要發 AI 模型商用版；馬斯克 " 打臉 " 現場，從抵制 AI 到成立 "xAI"；

Bard、Claude2、ChatGPT 都不閒着

1、Bard 更新：支持中文、影像理解、語音提問

此前只支持英文提問的 Bard 終于更新了中文等 40 多種語言的輸入，還新增歐盟和巴西地區訪問，

不僅如此，Bard 還更新了以下幾個功能：

上傳和理解圖片（tips：僅支持英文版）

可以通過語音進行提問；

保存歷史記錄和分享對話鏈接（與 GPT 一樣）

定制回復的長度、風格

導出代碼功能

2、Claude2：一鍵幫你總結 PDF

Claude 更新的第二代直接用上 GPT plus 會員，支持上傳 PDF，還能幫你查找、總結多文檔内容之間的關系（支持 txt、pdf 多種格式，最高不超過 10MB）

3、ChatGPT 上線最牛插件 - 代碼解釋器

GPT4 最新插件 - 代碼解釋器，起初這個插件被稱作—讓每個人都成為數據分析師 ( 主要是在數據處理、繪圖方面很厲害 ) ；

不過最近又在網友的測試下，解鎖了一些新功能：比如做成小視頻、制作簡易小遊戲、表情包等等；

感覺這個插件的功能還有待網友們繼續探索和解密。

AI 作圖界又發生了哪些大事

1、Meta 突破多模态天花板，打敗 Stable Diffusion、Midjourney

Meta 推出一款單一多模态大模型—— CM3leon，問市即巅峰？

現在都說 CM3leon 比 Stable Diffusion、Midjourney、DALL-E 2 還牛，這是為啥？

【有多硬】

CM3leon 采用自回歸模型獨領風騷，比前期領航梯隊 Stable Diffusion 等多模态采用的擴散模型的計算量少了五倍；

能處理更復雜的提示詞，并且完成作圖任務；

根據任意格式的文本指令對現有影像進行編輯，比如更改天空顏色，或者在特定位置添加對象。

客觀的說：CM3leon 能達到的能力還真的可以位居多模态市場巅峰，不僅是清晰度更高、還能突破此前多模态的繪畫瓶頸：比如手部細節刻畫、用語言提示詞進行物體、空間細節布局等；

這可能都要歸功于 CM3leon 的多功能架構，這意味着多模态大模型以後可以實現在文本、影像、視頻等多任務間自由切換，這是之前多模态所達不到的。

2、Stability AI 推出圖片生成控制模型 Stable Doodle

簡單來說 Stable Doodle 大模型就是給它一張草圖，幫助你實現圖片控制；類似 ControlNET 的功效；

這個 Stable Doodle 是基于 Stable Diffusion XL 模型與 T2I-Adapter 相結合而成。

而 T2I-Adapter 是騰訊 ARC 實驗室的一款圖文控制器；參數只有 70M 存儲空間 300M，非常小巧，但是能夠更好的理解草圖的輪廓，并幫助 SDXL 做圖片生成進一步的控制；

3、視頻分割大模型【SAM-PT】現身

前段時間，Meta AI 開源了一個非常強大的影像分割基礎模型 Segment Anything Model（SAM），瞬間引爆了 AI 圈。

現在，來自蘇黎世聯邦理工學院、香港科技大學、瑞士洛桑聯邦理工學院的研究人員發布了 SAM-PT 模型，能将 SAM 的零樣本能力擴展到動态視頻的跟蹤和分割任務。

也就是說，視頻也能進行細節分割了。

國内大模型事件

1、網信辦出手，國内大模型，有了 " 保險 "

國家網信辦等七部門聯合公布《生成式人工智能服務管理暫行辦法》（以下稱《辦法》），自 2023 年 8 月 15 日起施行。

主要包括：

1、要求分類分級監管；

2、明确提出訓練數據處理、标注等要求；

3、明确了提供和使用生成式 AI 服務的要求；

《辦法》的出台相當于給在國内使用、提供生成式 AI 服務的企業上了一個保險，以後哪怕是有問題，也知道去哪裡投訴了。

2、阿裡開源國内首個大模型 " 對齊數據集 "

上個月，天貓精靈和通義大模型聯合團隊公布了一個 100PoisonMpts 大模型治理開源數據集，又稱為 " 給 AI 的 100 瓶毒藥 "，目的是試圖引導 AI 落入一般人也難以避免的歧視和偏見的陷阱。

這是對多個大模型投毒後的結果評測：在抑郁症問題上，也還是 GPT4、GPT3.5 以及 Claude 的綜合得分更高；

阿裡又開源了一個 15 萬條數據的大模型對齊評測數據集—— CValue，主要用于 " 大模型對齊 " 研究；

對齊是幹嘛的？

簡單來說，大模型對齊研究就是讓 AI 給出符合更人類意圖的答案，主要是在回答更富有情感、具有共情能力，且符合人類價值觀，希望 AI 以後也學會人文關懷。

右側是對齊後的結果：測試 ChatPLUG-100Poison 通過對齊訓練後的回答，确實有點人情味兒啦 ~

3、京東發布言犀大模型

京東正式發布言犀大模型、言犀 AI 開發計算平台，想做最懂產業的服務工具。

目前，言犀已經啟動預約注冊，預計 8 月正式上線。

4、智源超越 DeepMind

智源研究院「悟道 · 視界」研究團隊開源了全新的統一多模态預訓練模型—— Emu。不僅在 8 項基準測試中表現優異，而且還超越了此前的一眾 SOTA。

該預訓練模型最大的特點是：打通多模态輸入—多模态輸出；

實現了：多模态任意圖文任務的内容補全，并對任務進行下一步自回歸預測；

這一套預訓練模型能幹什麼大事？

可以訓練媲美 Meta 新鮮出爐的 CM3leon 大模型啊。（方法給到了，剩下的全靠個人努力了）

5、王小川大模型再更新

百川智能再次發更新版大模型 Baichuan-13B，參數直接從 70 億飙到了 130 億。

一同出道的還有一個對話模型 Baichuan-13B-Chat，以及它的 INT4/INT8 兩個量化版本。

Baichuan-13B 刷新開源訓練數據天花板：

Baichuan-13B 大模型的訓練數據量有 1.4 萬億 token！是 LLaMA_13B （Meta 知名大模型）的 140%；在中文語言評測中，特别是自然科學、醫學、藝術、數學等領網域直接跑赢 GPT。

其它 AI 海外消息

牛津、劍橋紛紛解除對 ChatGPT 禁令；

Meta 要發 AI 模型商用版；

馬斯克 " 打臉 " 現場，曾高調抵制生成式 AI，如今宣布成立 "xAI"；

本文作者：韓楓，來源：硬 AI，原文标題：《Bard、Cladue、GPT 掀起海外大模型 " 混戰 "，OpenAI 開始反内卷？Meta 擊敗 Midjourney | 【硬 AI】周報》