今天小編分享的互聯網經驗:字節回應被OpenAI“拉黑”:服務條例更新前已停止使用GPT訓練模型,歡迎閱讀。
文 | 周鑫雨
編輯 | 鄧詠儀
2023 年 12 月 16 日,科技媒體 the Command Line 作者 Alex Health 的一篇文章,将 OpenAI 對字節跳動的控訴擺到了台前。
這篇 " 檄文 " 中,字節被指控在大語言模型開發項目 Project Seed 中,幾乎每個階段都在秘密使用 OpenAI 的模型 API 來訓練和評估模型。
" 參與的員工們對此心知肚明。"Alex Health 聲稱自己在字節的溝通平台飛書上親眼所見,員工讨論如何通過數據脫敏來粉飾證據," 濫用非常普遍,以至于 Project Seed 的員工經常達到訪問 API 次數的上限。"
這場控訴的結局是,OpenAI 禁止了字節跳動的賬戶。OpenAI 發言人 Niko Felix 通過 Alex Health 發表了聲明:
所有 API 客戶都必須遵守我們的使用政策,以确保我們的技術得到良好利用。雖然字節跳動對我們 API 的使用很少,但我們在進一步調查期間已暫停了他們的帳戶。如果我們發現他們的使用不遵守這些政策,我們将要求他們進行必要的更改或終止其帳戶。
OpenAI 發言人 Niko Felix 的聲明。
所謂的 "Seed",是字節在 2022 年末就啟動的基礎大語言模型開發項目。該項目下有兩個主要產品,一個是已在國内推出的聊天機器人 " 豆包 ",一個則是正在開發中的、計劃通過火山引擎對外提供服務的機器人平台。
一名業内人士對 36 氪表示,國内廠商用國外主流模型的 API 先試水業務、訓練模型的情況并不少見:" 先用先進模型把業務跑起來,等自己的模型訓練能力達到标準再進行替換。"
而多名知情人士則向 36 氪透露,目前字節跳動的模型業務比距,無論是產品項目 Flow,還是大模型項目 Seed,都有國内海外業務兩手抓的打算。由于政策規定,國内業務将采用字節自主研發的模型,而海外業務,将先采用國外廠商的模型 API 服務。
在 OpenAI 的服務條例中,确實存在競争保護相關的内容。為了防止客戶使用 OpenAI 的服務開發競品,OpenAI 對客戶的使用範圍做了嚴格的規定:只允許開發非商用的用于數據治理的 AI 模型,或者用于微調 OpenAI 對外服務的模型。
OpenAI 的服務條例。
" 拉黑 " 風波後,字節跳動發言人 Jodi Seth 在當日也快速做出回應。她表示,GPT 生成的數據在 Project Seed 早期被用于标注模型,并在今年年中左右從字節跳動的訓練數據中删除:
字節跳動獲得了微軟使用 GPT API 的許可。我們使用 GPT 為非中國市場的產品和功能提供動力,但使用我們的自我發展模型為豆包提供動力,豆包僅在中國可用。
這則聲明承認了字節存在用 GPT 生成的數據訓練模型的行為,但這個行為發生在 OpenAI 設定服務條例之前。可見的是,OpenAI 最早一版服務條例發布于 2023 年 8 月 28 日,而字節聲稱在年中前已經停止将 GPT 生成的數據應用于訓練過程。
OpenAI 的第一版服務條例更新于 2023 年 8 月。
字節回應的另一個重點,則是強調 GPT 的 API 服務是通過微軟雲服務 Azure,而非從 OpenAI 直接獲得。換言之,OpenAI 的 " 拉黑 ",顯得越俎代庖。
不過,即便是微軟 Azure,也擁有與 OpenAI 類似的競争保護條款:" 客戶不得使用且不允許第三方使用微軟生成式人工智能服務創建、培訓或改進(直接或間接)類似或具有競争性的產品或服務。"
微軟 Azure 生成式人工智能服務條款
如今,不少人都在等待微軟 Azure 的回應。對海外 AI 業務依賴于國外廠商 API 的字節而言,微軟的态度将至關重要。
歡迎交流