今天小編分享的科技經驗:張一鳴的路,OpenAI走得通嗎?,歡迎閱讀。
OpenAI 和美國媒體的互掐,越來越有看頭了。
當地時間 1 月 9 日,OpenAI 終于打破了近兩周的沉默,公開發表長文回應美國媒體的指控。去年 12 月 27 日,美國媒體在美國起訴 ChatGPT 制造商 OpenAI 及其合作夥伴微軟,指控後者未經許可使用數百萬篇文章訓練 AI。
這次 OpenAI 的回應不是白開水般的公關措辭,而是犀利地指出,美國媒體沒有講述完整的經過,且有故意操縱 ChatGPT 回答結果之嫌,整個訴訟毫無根據。
一邊是代表着新科技的 ChatGPT,一邊是代表着老牌新聞機構的美國媒體,二者對簿公堂,原本就是注定寫進科技史的事件。如今 OpenAI 頗為 " 頭鐵 " 的回應,更是為事件火上澆油。
回頭看,不管是廣播、電視、互聯網,新的媒介產生,都會與内容版權方產生利益拉扯,其中又尤以新聞業最為激烈。
無獨有偶,OpenAI 如今高舉的依然是 " 合作 " 的旗。在對美國媒體毫不客氣地回怼之餘,也強調了 " 可退出 " 原則,以及與新聞機構合作的強烈意願。
但這次,美國媒體們只會更加謹慎——直到現在,社交媒體如 Facebook、搜索引擎如谷歌與新聞業仍舊沒有達成一致,新聞業想要從平台獲得更多抽成,而平台則不願輕易配合。
OpenAI 抛出合作之 " 餅 ",美國媒體們可能不會輕易吃下了。
OpenAI 和美國媒體,都握緊了拳頭。
自 ChatGPT 在 2022 年底推出以來,OpenAI 沒少吃版權官司。去年 9 月,就有十餘名作家對 OpenAI 提起訴訟,幾個月後的 12 月,又有 11 名美國作家在紐約曼哈頓聯邦法院起訴 OpenAI 和微軟。
但美國媒體的訴狀,分量畢竟不同。一來美國媒體本身是西方最主流、最大的老牌媒體之一,二來美國媒體的起訴來勢洶洶。
起訴 OpenAI,美國媒體一口氣向法院提交了 22000 頁的附件和狀書,其中對 ChatGPT 侵權的關鍵證據多達 100 個,顯示 ChatGPT 輸出的内容和美國媒體高度相似。
在一個典型的證據片段中,左邊是 GPT-4 的輸出結果,右邊是美國媒體原文,重合的文字以紅色顯示,像極了中文互聯網上每次 " 錘 " 抄襲時會用的 " 調色盤 " 技能。
訴狀中表示,光是美國媒體的文章構成了 Common Crawl 中用于訓練 GPT 的最大單個專有數據集(Common Crawl 是一個基金會,16 年來已經幾乎存檔了整個網絡)。美國媒體要求 OpenAI 和微軟銷毀包含侵權材料的模型和訓練數據,沒有提出具體索賠金額,但表示被告應該對非法復制和使用美國媒體獨有價值的作品相關的 " 數十億美元的法定和實際損失 " 負責。
除此之外,美國媒體還指出,由于 AI" 幻覺 ",ChatGPT 有時會将一些假新聞、謠言 " 張冠李戴 ",說成是出自美國媒體的,對其名譽造成損害。
再表态時,OpenAI 也不客氣,發長文,抛出四個關鍵點:1、OpenAI 願意和新聞機構合作并創造新機會;2、使用公開的互聯網材料訓練 AI 模型是合理的,但 OpenAI 還是提供了退出機制;3、反刍事實(regurgitate facts)确實是一種罕見的錯誤,OpenAI 正在努力将其減少到零;4、美國媒體沒有完整講述故事,其訴訟毫無根據。
其中提到的 " 反刍 ",就是指 AI 将訓練物料原封不動地 " 吐出來 ",就像美國媒體所列舉的那樣,AI 的回答和美國媒體的文章幾乎一字不差。OpenAI 的立場是," 反刍 " 現象的确存在,但 OpenAI 已經将其程度降到很低,美國媒體一下拿出上百個 " 反刍 " 例子,是很可疑的。
因此,OpenAI 懷疑:" 有趣的是,美國媒體提到的反刍似乎來自多個第三方網站上大量傳播的多年前的文章。他們似乎故意操縱提示,通常包括冗長的文章摘錄,以便讓我們的模型反刍。即使使用這樣的提示,我們的模型通常也不會像美國媒體暗示的那樣表現,這表明他們要麼指示模型反刍,要麼從多次嘗試中精心挑選示例。"
總而言之就是:說我家孩子偷東西?我看是你塞孩子手裡、搞栽贓吧?
除此之外,OpenAI 的回應中還有兩點值得玩味。
首先,OpenAI 強調了 " 退出 " 機制,并指出美國媒體早在去年 8 月就已經采用推出流程。實際上,美國媒體、英國媒體、CNN 等在内的多家主流新聞媒體都已在去年起屏蔽 OpenAI 的 GPTBot 網絡爬蟲,以限制其繼續獲取這些媒體的内容。
其次,OpenAI" 殺人誅心 ",否定了美國媒體一家媒體在 ChatGPT 訓練中的重要性:" 由于模型是從人類知識的巨大集合中學習的,因此任何一個部門(包括新聞)都只是整體訓練數據的一小部分,而任何單一數據源(包括美國媒體)對于模型的預期學習并不重要。"
" 我不是、我沒有、你别瞎說啊 " 的否認三連,放在 OpenAI 身上正合适。
既然 AI 已經是未來趨勢,OpenAI 也有意願合作,美國媒體為何還要大動幹戈?
" 人工智能 30% 都來源于新聞業。讓我們不要再犯同樣的錯誤、再一次免費地付出一切。"" 我們的内容正在被盜竊,我們必須說:這次不行。"《媒體創新 2023 年世界報告》中寫道。
" 不要犯同樣的錯誤 ",類似的措辭,當 OpenAI 的 CEO 山姆 · 阿爾特曼坐在美國國會聽證席上時也聽到過。彼時國會議員數次表達後悔,稱不能重蹈社交媒體時代的覆轍。社交媒體時代,監管被遠遠落在科技發展之後,扎克伯格 2018 年首次因 " 劍橋醜聞 " 坐上國會聽證席時,Facebook 已經推出 14 年。
從某種角度來說,OpenAI 的确是站在了巨人的肩膀上——有了前車之鑑,ChatGPT 一朝出名,立刻引來四方警惕。
美國媒體們也不想重蹈覆轍。在搜索引擎和社交媒體成為流量入口的時代,傳統媒體艱難轉型,也曾和大型科技平台達成 " 合作 ",但後來卻覺得這不 " 值 "。
Facebook 很早就和傳統媒體展開合作,美國媒體也是首批入駐的媒體,那時的合作模式是利潤抽成,分發在 Facebook 的平台完成。但随着 2018 年 Facebook 和谷歌母公司獲得美國數字廣告收入的 60%,媒體機構開始覺得自己被奪走得太多、得到的卻太少。
2019 年,美國媒體曾發布報道:美國新聞業數字廣告年收入 51 億美元,而谷歌提供聚合新聞服務所獲得的數字廣告收入 47 億美元。
新聞出版商在多個國家和地區争取更多利益。2020 年,澳大利亞政府成為第一個要求 Facebook 和谷歌為新聞内容付費的國家。2023 年,加拿大也通過了《在線新聞法》,随後谷歌與當局達成協定,同意向加拿大新聞出版商支付 7400 萬美元。而 Facebook 的制造商 Meta 卻拒絕妥協,幹脆不在加拿大當地屏蔽新聞内容。美國《新聞競争與保護法案》也曾在國會推進,但未獲得全體投票機會。
撰寫《媒體創新 2023 年世界報告》的創新媒體咨詢集團創始人胡安 · 賽諾在演講中直言:" 我們不能在别人的平台上建立自己的業務,無論是 Facebook 還是谷歌,大型科技公司并不關心我們的利益。"" 他們有自己的利益,為什麼要指望他們照顧我們的利益呢?形式主義盛行,收入卻太少。"
要知道,美國媒體本身是在紙媒衰落之時浴火重生的榜樣,2008 年次貸危機後,其一度抵押總部大樓借款,甚至多方出手想要将其收購。随着大舉進行數字化轉型,推出付費訂閱模式,美國媒體最終扭虧為盈。在 2022 年,美國媒體超過六成收入都來自付費訂閱。
由此,也就不難理解美國媒體要和 OpenAI" 魚死網破 " 的架勢從何而來:" 合作 " 說起來簡單,但怎麼合作才能保證美國媒體們原有的利益不受侵害、新的商機不被奪走?問号很多,答案寥寥。
" 利用美國媒體在報道中的巨大投入,在搭新聞行業的便車。" 美國媒體的怨氣,不僅來自 " 初出茅廬 " 的 ChatGPT。
對于 OpenAI 來說,這注定是一場硬仗。
除了多點爆發的版權之争,歐洲已經于去年 6 月表決通過《AI 法案》草案。根據該法案,OpenAI 等廠商需要公開在訓練模型過程中使用的受版權保護的版權數據清單。
雖然在此次的聲明中強調美國媒體 " 不重要 ",但版權内容對于 OpenAI 的大模型訓練還是很重要的。
在前不久提交給英國上議院通信和數字事務特别委員會關于大語言模型調查的檔案中,OpenAI 承認,像 ChatGPT 這樣的 AI 工具的開發離不開受版權保護的素材,并稱如果沒有這些素材,GPT 根本無法誕生:" 由于當前版權涵蓋了幾乎所有形式的人類表達方式,包括博客文章、照片、論壇帖子、軟體代碼片段和政府檔案,如果不使用受版權保護的内容,就不可能訓練當今領先的人工智能模型。"
在和美國媒體隔空互怼的同時,OpenAI 也在積極推進與新聞業的 " 合作 ",已經取得部抽成果。
去年 12 月,美國媒體起訴 OpenAI 前不久,OpenAI 與德國新聞出版巨頭阿克塞爾 · 施普林格(Axel Springer)達成合作。施普林格是歐洲最大的數字出版公司,旗下包括 Business Insider、《世界報》等在内的知名新聞品牌。
雙方籤訂為期多年的協定,ChatGPT 可以在回復中給用戶提供施普林格新聞媒體的報道摘要,包含原始出處和鏈接,保證新聞網站獲得流量。同時,施普林格的内容将被 OpenAI 用于訓練模型。Information 援引知情人士稱,該交易在上千億美元規模。
這已經是 OpenAI 與新聞機構達成的第二個大型合作,同年 7 月其曾與美國媒體達成類似協定,金額未公開。
競争也會進一步推高新聞采集的成本。去年 12 月,媒體報道蘋果已經和多家主要出版商達成協定,采集其新聞内容訓練 AI 模型。報道稱,蘋果已經和 NBC 新聞、IAC 等多家機構接洽,拟議交易金額至少 5000 萬美元。
僅僅勾一勾 " 廣告抽成 " 的手指頭,就引來主流媒體争相入駐,那種 " 好時代 " 屬于社交媒體和搜索引擎。如今的 OpenAI 們,不得不畫更大、更香的餅。