字節回應被OpenAI“拉黑”：服務條例更新前已停止使用GPT訓練模型

今天小編分享的互聯網經驗：字節回應被OpenAI“拉黑”：服務條例更新前已停止使用GPT訓練模型，歡迎閱讀。

文 | 周鑫雨

編輯 | 鄧詠儀

2023 年 12 月 16 日，科技媒體 the Command Line 作者 Alex Health 的一篇文章，将 OpenAI 對字節跳動的控訴擺到了台前。

這篇 " 檄文 " 中，字節被指控在大語言模型開發項目 Project Seed 中，幾乎每個階段都在秘密使用 OpenAI 的模型 API 來訓練和評估模型。

" 參與的員工們對此心知肚明。"Alex Health 聲稱自己在字節的溝通平台飛書上親眼所見，員工讨論如何通過數據脫敏來粉飾證據，" 濫用非常普遍，以至于 Project Seed 的員工經常達到訪問 API 次數的上限。"

這場控訴的結局是，OpenAI 禁止了字節跳動的賬戶。OpenAI 發言人 Niko Felix 通過 Alex Health 發表了聲明：

所有 API 客戶都必須遵守我們的使用政策，以确保我們的技術得到良好利用。雖然字節跳動對我們 API 的使用很少，但我們在進一步調查期間已暫停了他們的帳戶。如果我們發現他們的使用不遵守這些政策，我們将要求他們進行必要的更改或終止其帳戶。

OpenAI 發言人 Niko Felix 的聲明。

所謂的 "Seed"，是字節在 2022 年末就啟動的基礎大語言模型開發項目。該項目下有兩個主要產品，一個是已在國内推出的聊天機器人 " 豆包 "，一個則是正在開發中的、計劃通過火山引擎對外提供服務的機器人平台。

一名業内人士對 36 氪表示，國内廠商用國外主流模型的 API 先試水業務、訓練模型的情況并不少見：" 先用先進模型把業務跑起來，等自己的模型訓練能力達到标準再進行替換。"

而多名知情人士則向 36 氪透露，目前字節跳動的模型業務比距，無論是產品項目 Flow，還是大模型項目 Seed，都有國内海外業務兩手抓的打算。由于政策規定，國内業務将采用字節自主研發的模型，而海外業務，将先采用國外廠商的模型 API 服務。

在 OpenAI 的服務條例中，确實存在競争保護相關的内容。為了防止客戶使用 OpenAI 的服務開發競品，OpenAI 對客戶的使用範圍做了嚴格的規定：只允許開發非商用的用于數據治理的 AI 模型，或者用于微調 OpenAI 對外服務的模型。

OpenAI 的服務條例。

" 拉黑 " 風波後，字節跳動發言人 Jodi Seth 在當日也快速做出回應。她表示，GPT 生成的數據在 Project Seed 早期被用于标注模型，并在今年年中左右從字節跳動的訓練數據中删除：

字節跳動獲得了微軟使用 GPT API 的許可。我們使用 GPT 為非中國市場的產品和功能提供動力，但使用我們的自我發展模型為豆包提供動力，豆包僅在中國可用。

這則聲明承認了字節存在用 GPT 生成的數據訓練模型的行為，但這個行為發生在 OpenAI 設定服務條例之前。可見的是，OpenAI 最早一版服務條例發布于 2023 年 8 月 28 日，而字節聲稱在年中前已經停止将 GPT 生成的數據應用于訓練過程。

OpenAI 的第一版服務條例更新于 2023 年 8 月。

字節回應的另一個重點，則是強調 GPT 的 API 服務是通過微軟雲服務 Azure，而非從 OpenAI 直接獲得。換言之，OpenAI 的 " 拉黑 "，顯得越俎代庖。

不過，即便是微軟 Azure，也擁有與 OpenAI 類似的競争保護條款：" 客戶不得使用且不允許第三方使用微軟生成式人工智能服務創建、培訓或改進（直接或間接）類似或具有競争性的產品或服務。"

微軟 Azure 生成式人工智能服務條款

如今，不少人都在等待微軟 Azure 的回應。對海外 AI 業務依賴于國外廠商 API 的字節而言，微軟的态度将至關重要。

歡迎交流