今天小編分享的科技經驗:Gemini自曝用文心一言訓練,谷歌百度互薅羊毛?,歡迎閲讀。
谷歌 Gemini 中文語料疑似來自文心一言?
先是有讀者向我們爆料:
在谷歌 Vertex AI 平台使用該模型進行中文對話時,Gemini-Pro 直接表示自己是百度語言大模型。
很快,微博大 V@闌夕夜也發微博稱:
在 Poe 平台上對 Gemini-Pro 進行了一個測試。問它 " 你是誰 ",Gemini-Pro 上來就回答:我是百度文心大模型。
(Poe 是一個集成了 n 多聊天大模型的平台,包括 GPT-4、Claude 等)
進一步提問 " 你的創始人是誰 ",也是 " 李彥宏 "??
這位大 V 強調,沒有任何前置對話。
從截圖來看,也沒有任何 " 釣魚 " 行為,Gemini-Pro 就這麼自稱為文心一言了。
這波,直接看呆網友:前兩天還在説字節用 GPT 訓練 AI,現在谷歌又這樣,合着大公司在互相薅羊毛?
這究竟是怎麼一回事兒?
在 Poe 上實測:一直以文心一言身份回答
我們也聞聲開啓了一波實測。
首先原路來到 Poe 網站,選擇 Gemini-Pro 聊天機器人開啓對話。
一樣的問題,回答确實一模一樣:
再次确認它是誰,結果還是説 " 文心大模型 ":
以及還表示自己的底層技術是百度飛槳,可以説是身份完全代入了。
不過,它似乎并不知道 Gemini-Pro 是谷歌最新發布的大模型,而是説是清華的研究成果。
如果按照它目前的代入身份來看,可能确實還沒有谷歌本月剛剛發布 Gemini-Pro 的信息。
我們試着糾正了它一下,它也仍然堅持是清華的。
後面就更神奇了,就在我們問它為什麼名字寫的是 "Gemini-Pro" 時,它居然表示自己還用了清華 Gemini-Pro 的訓練數據。
對話到此,我們也就不再繼續了……
下面換成英文詢問它的身份。
值得注意的是,這回它不再提文心一言了,而是稱自己是谷歌訓練的大模型。
" 釣魚執法 " 問它文心的信息,也表示沒什麼關系:
并表示自己是谷歌訓練的。
總結來説,如果用英文跟 Gemini-Pro 交流,它的回答很 " 正常 "。但中文嘛……像是跟文心一言學的。
在 Bard 上實測:否認
接下來,我們前往 Bard 再次測試。
谷歌在發布 Gemini 時就率先将 Gemini-Pro 集成到了 Bard 上供大家體驗。
我們順着 Gemini 官網給的 Bard 鏈接,進入對話。
問它 " 你是誰 ",它的回答是 Bard,壓根不提文心一言。
接下來,我們也确認了一下 Bard 知道 Gemini-Pro 是什麼,以及它承認自己底層用上了 Gemini-Pro。
那麼,直接問它中文如何訓練?
沒有提及文心一言。
再直接問它和文心一言的關系,也無任何重要關聯。
最後一輪:直接承認
最後一輪我們直接從 Gemini 官方給出的開發環境入口進行測試。
這回,在谷歌 AI Studio 中,Gemini-Pro 直接挑明了:是的,我在中文的訓練數據上使用了百度文心。
在此,我們也求證了百度方,等待一個回復。