OpenAI為節約成本偷工減料？史上最強大模型GPT-4“變笨”

今天小編分享的财經經驗：OpenAI為節約成本偷工減料？史上最強大模型GPT-4“變笨”，歡迎閱讀。

如今距離 OpenAI 于 3 月中旬推出其最新版本的大型語言模型 GPT-4 已經有近 3 個月的時間。這段時間内，盡管全球資本市場對人工智能、大模型和算力的炒作此起彼伏，也有人稱贊 GPT-4 這個版本強大的能力，但卻很少有人質疑 GPT-4 是否真的比此前更早期的版本強大。

近期，網上對 GPT-4 是否出現退化的質疑聲開始湧現出來，越來越多的網友開始表示，GPT-4 對復雜程度相似的問題處理結果甚至還不如它的前身 GPT-3 或 GPT-3.5。面對網友的大量質疑，OpenAI 官方開發者推廣大使回應稱，GPT-4 處于靜止狀态，且自 3 月 14 日發布以來沒有做過改動。

可能突破萬億參數的 GPT-4，被 OpenAI" 狂吹 "

根據 OpenAI 自己的說法，GPT-3 擁有 1750 億個參數，但 GPT-4 的規模可能會達到數千億個參數，甚至可能會突破萬億級别。這一規模的提升将有助于提高模型的表現力和泛化能力，使其更能适應各種語言任務，同時也意味着 GPT-4 接受了更多的數據訓練，模型檔案中有更多的權重（參數），這也使得它的運行成本更高。

此外，GPT-4 可以更準确地解決人們的難題，多模态的 GPT-4 還可以生成、編輯具有創意性或技術性的文章，在高級推理方面的表現超過其前身。當然，正如大家所猜測的那樣，微軟 New Bing 的聊天功能确實基于 GPT-4。OpenAI 稱，該模型 " 比以往任何時候都更具創造性和協作性 "，" 可以更準确地解決難題 "。它可以解析文本和影像輸入，盡管它只能通過文本進行響應。

官方表示，GPT-4 錯誤答案更少，而且也會減少偏離話題的可能，也盡可能不會再談論禁忌話題，甚至在許多标準化測試中比人類表現得都要更好一些。

例如，GPT-4 在模拟律師考試的成績在考生中排名前 10% 左右，在 SAT 閱讀考試中排名前 7% 左右，在 SAT 數學考試中排名前 11% 左右。相比之下，GPT-3.5 在律師考試中的得分一般都是倒數 10% 左右。當然，它們考個研究生還是沒問題的。

圖片來源：OpenAI

不少業内人士也對 GPT-4 的未來應用前景表示看好，稱 GPT-4 的出現将進一步推動 AI 語言模型領網域的發展。作為下一代 AI 語言模型，GPT-4 将會在各方面都得到進一步的改善，包括語言理解、生成、多語種支持等等。同時，GPT-4 也将會在各個應用場景中得到廣泛應用，為各個行業帶來更加高效和智能的解決方案。

有網友 4 月份就對 GPT-4 是否退化發出質疑

那麼，GTP-4 真的如 OpenAI 自己所稱的那樣更強大嗎？

就在美東時間本周早些時候，Ycombinator 上已有網友提出質疑，稱 "（GPT-4）确實比以前快很多，但它的輸出質量更像是 GPT-3.5++。GPT-4 產生了更多的 bug 代碼，答案也缺乏深度和分析，總體感覺上比以前要糟糕很多。"

圖片來源：Ycombinator

在上述網友的帖子下方，另一名網友回復稱，" 是的。在更新之前，GPT（的上一個版本）能毫不費力地解決相當復雜的編程問題，并對非編程問題給出非常微妙且像是經過深思熟慮的答案。如今，GPT-4 只能修改一個 10 行 CSS 模塊中的兩行，并再次給出這修改後的 10 行模塊，不僅感到非常吃力，而且給出的答案中有些内容毫無關系 ……"

還有網友表示，"OpenAI 的（最新）模型給我的感覺是 100% 被削弱了。幾個月前我用它（的早期版本）解決了非常復雜的問題（例如編寫一個最小的 PDF 解析器示例），但今天你會因為問了這麼復雜的任務被 GPT-4 ‘責備’。"這名網友最後還稱，他已經決定取消訂閱他的 OpenAI 會員資格。

在推特上，有網友稱把GPT-4 的 3 小時 25 條對話額度一口氣用完了，都沒能解決自己的代碼問題，最後無奈切換回了 GPT-3.5。

圖片來源：推特

《每日經濟新聞》記者還注意到，網上關于 GPT-4 是否退化的讨論，其實在 1 個月前就已經有了。當時有網友在美國版天涯 + 貼吧平台 Reddit 上，對 GPT-4 是否 " 變笨 " 發出質疑。這名當時網友稱，" 在過去幾天裡，我經歷了 GPT-4 性能的明顯下降。它的推理能力已經退化到 GPT-3 的水平，而且它正在努力完成上個月剛剛為我完成的任務。今晚的性能還是最糟糕的。這是怎麼回事？"

圖片來源：Reddit

在 OpenAI 的官方開發者論壇，有網友在 4 月 30 日就發帖稱，" 一周前，我用 GPT4 為 MS 飛行模拟器創建了一個非常簡單的 C# 應用程式。這太神奇了，我只（手動）更正了一次。今天我用了同樣的提示詞，但經過多次修改後 GPT-4 還是不能正常使用。"

一時間，關于 "GPT-4 退化了 "、"OpenAI 為了節省成本開始偷工減料 " 等質疑聲開始在 Ycombinator、Reddit 和推特等平台快速蔓延開來。速度如此之快，就連 OpenAI 官方的開發者推廣大使 Logan Kilpatrick 都出面來公開回應網友的質疑："API 不會在沒有我們通知您的情況下更改。"

在上述推文下方，Logan 還回復了網友一些問題，他稱，GPT-4 自從 3 月 14 日發布以來未發生改動。他還表示，GPT-4 對于一些提示詞給出的回答内容不一致，是由于大模型本身不穩定。不過，針對網頁版 GPT-4 是否被降級過的追問，均未得到其本人的正面回答。

另據監管機構 NewsGuard 的專家分析，OpenAI 最新版本的 GPT-4 大型語言模型在輸出信息方面，确實比它的前身 GPT-3.5 還要糟糕。在今年 3 月份發布的報告中，NewsGuard 就指出，GPT-4 不僅在其研究人員的提示下回答了完全虛假的新聞叙述，而且甚至比 GPT-3.5 回答的内容更差。

每日經濟新聞