今天小編分享的财經經驗:OpenAI為節約成本偷工減料?史上最強大模型GPT-4“變笨”,歡迎閱讀。
如今距離 OpenAI 于 3 月中旬推出其最新版本的大型語言模型 GPT-4 已經有近 3 個月的時間。這段時間内,盡管全球資本市場對人工智能、大模型和算力的炒作此起彼伏,也有人稱贊 GPT-4 這個版本強大的能力,但卻很少有人質疑 GPT-4 是否真的比此前更早期的版本強大。
近期,網上對 GPT-4 是否出現退化的質疑聲開始湧現出來,越來越多的網友開始表示,GPT-4 對復雜程度相似的問題處理結果甚至還不如它的前身 GPT-3 或 GPT-3.5。面對網友的大量質疑,OpenAI 官方開發者推廣大使回應稱,GPT-4 處于靜止狀态,且自 3 月 14 日發布以來沒有做過改動。
可能突破萬億參數的 GPT-4,被 OpenAI" 狂吹 "
根據 OpenAI 自己的說法,GPT-3 擁有 1750 億個參數,但 GPT-4 的規模可能會達到數千億個參數,甚至可能會突破萬億級别。這一規模的提升将有助于提高模型的表現力和泛化能力,使其更能适應各種語言任務,同時也意味着 GPT-4 接受了更多的數據訓練,模型檔案中有更多的權重(參數),這也使得它的運行成本更高。
此外,GPT-4 可以更準确地解決人們的難題,多模态的 GPT-4 還可以生成、編輯具有創意性或技術性的文章,在高級推理方面的表現超過其前身。當然,正如大家所猜測的那樣,微軟 New Bing 的聊天功能确實基于 GPT-4。OpenAI 稱,該模型 " 比以往任何時候都更具創造性和協作性 "," 可以更準确地解決難題 "。它可以解析文本和影像輸入,盡管它只能通過文本進行響應。
官方表示,GPT-4 錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談論禁忌話題,甚至在許多标準化測試中比人類表現得都要更好一些。
例如,GPT-4 在模拟律師考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數學考試中排名前 11% 左右。相比之下,GPT-3.5 在律師考試中的得分一般都是倒數 10% 左右。當然,它們考個研究生還是沒問題的。
圖片來源:OpenAI
不少業内人士也對 GPT-4 的未來應用前景表示看好,稱 GPT-4 的出現将進一步推動 AI 語言模型領網域的發展。作為下一代 AI 語言模型,GPT-4 将會在各方面都得到進一步的改善,包括語言理解、生成、多語種支持等等。同時,GPT-4 也将會在各個應用場景中得到廣泛應用,為各個行業帶來更加高效和智能的解決方案。
有網友 4 月份就對 GPT-4 是否退化發出質疑
那麼,GTP-4 真的如 OpenAI 自己所稱的那樣更強大嗎?
就在美東時間本周早些時候,Ycombinator 上已有網友提出質疑,稱 "(GPT-4)确實比以前快很多,但它的輸出質量更像是 GPT-3.5++。GPT-4 產生了更多的 bug 代碼,答案也缺乏深度和分析,總體感覺上比以前要糟糕很多。"
圖片來源:Ycombinator
在上述網友的帖子下方,另一名網友回復稱," 是的。在更新之前,GPT(的上一個版本)能毫不費力地解決相當復雜的編程問題,并對非編程問題給出非常微妙且像是經過深思熟慮的答案。如今,GPT-4 只能修改一個 10 行 CSS 模塊中的兩行,并再次給出這修改後的 10 行模塊,不僅感到非常吃力,而且給出的答案中有些内容毫無關系 ……"
還有網友表示,"OpenAI 的(最新)模型給我的感覺是 100% 被削弱了。幾個月前我用它(的早期版本)解決了非常復雜的問題(例如編寫一個最小的 PDF 解析器示例),但今天你會因為問了這麼復雜的任務被 GPT-4 ‘責備’。"這名網友最後還稱,他已經決定取消訂閱他的 OpenAI 會員資格。
在推特上,有網友稱把GPT-4 的 3 小時 25 條對話額度一口氣用完了,都沒能解決自己的代碼問題,最後無奈切換回了 GPT-3.5。
圖片來源:推特
《每日經濟新聞》記者還注意到,網上關于 GPT-4 是否退化的讨論,其實在 1 個月前就已經有了。當時有網友在美國版天涯 + 貼吧平台 Reddit 上,對 GPT-4 是否 " 變笨 " 發出質疑。這名當時網友稱," 在過去幾天裡,我經歷了 GPT-4 性能的明顯下降。它的推理能力已經退化到 GPT-3 的水平,而且它正在努力完成上個月剛剛為我完成的任務。今晚的性能還是最糟糕的。這是怎麼回事?"
圖片來源:Reddit
在 OpenAI 的官方開發者論壇,有網友在 4 月 30 日就發帖稱," 一周前,我用 GPT4 為 MS 飛行模拟器創建了一個非常簡單的 C# 應用程式。這太神奇了,我只(手動)更正了一次。今天我用了同樣的提示詞,但經過多次修改後 GPT-4 還是不能正常使用。"
一時間,關于 "GPT-4 退化了 "、"OpenAI 為了節省成本開始偷工減料 " 等質疑聲開始在 Ycombinator、Reddit 和推特等平台快速蔓延開來。速度如此之快,就連 OpenAI 官方的開發者推廣大使 Logan Kilpatrick 都出面來公開回應網友的質疑:"API 不會在沒有我們通知您的情況下更改。"
在上述推文下方,Logan 還回復了網友一些問題,他稱,GPT-4 自從 3 月 14 日發布以來未發生改動。他還表示,GPT-4 對于一些提示詞給出的回答内容不一致,是由于大模型本身不穩定。不過,針對網頁版 GPT-4 是否被降級過的追問,均未得到其本人的正面回答。
另據監管機構 NewsGuard 的專家分析,OpenAI 最新版本的 GPT-4 大型語言模型在輸出信息方面,确實比它的前身 GPT-3.5 還要糟糕。在今年 3 月份發布的報告中,NewsGuard 就指出,GPT-4 不僅在其研究人員的提示下回答了完全虛假的新聞叙述,而且甚至比 GPT-3.5 回答的内容更差。
每日經濟新聞